網站遲遲不被百度收錄原因:
1.200以外響應代碼:
如果頁面沒有生成200服務器響應代碼,那么就不要指望搜索引擎將它們編入索引。有時URL會被進行意外重定向,產生404或 500錯誤,具體取決于CMS問題,服務器問題或用戶錯誤。如出現該種問題,請抓緊時間檢查以確保正確加載頁面網址。
2.Robots.txt阻止:
網站的robots.txt文件可以說是為百度提供了抓取命令。如果網站上的某個特定網頁缺少不被百度索引,那么robots.txt文件是先要檢查地方之一,如果要查看URL是否被robots.txt文件阻止,請去百度站長管理平臺進行“抓取診斷”測試即可。
3.“Noindex”元機器人標簽:
網站上的某個網頁可能無法在百度中編入索引的另一個原因就是,可能在網頁的<head>中有一個“noindex”元機器人標記。而一旦百度看到這個元機器人標簽,則將始終遵從此命令進行。而我們想要檢查網頁是否有“noindex”元機器人標記,就可查看源代碼并在<head>中查找代碼。如果網站通過javascript進行渲染的話,那么就需要通過使用Google Chrome“檢查元素”功能才能正確查看<head>。
4.“Noindex”X-Robots標簽:
5.內容重復:
內容重復是網站優化中讓眾多站長比較頭疼的問題,畢竟大量的重復內容將會使得我們的網頁遠離百度索引,如果網頁上重復內容過多,那么必將對排名造成不小的影響。
6.整體指數缺乏價值:
特定頁面或整個網站內容可能非常差,以至于無法為百度索引提供足夠價值。比如只有動態生成廣告的聯盟網站對用戶是毫無參考價值。百度已經改進了算法,以避免這樣的網站獲取好的排名。
7.網站仍是新的和未經證實的:
新網站不會被百度和其它搜索引擎迅速編入索引,它需要鏈接和其它信號才能讓百度在其搜索結果中對網站進行索引和排名。這也就是為啥說鏈接建設對新網站尤為重要的一個原因,對于剛剛上線的網站而言,可以在上線后直接向百度提交鏈接請求,通常會在1小時左右網站主頁就會被收錄了。