目前百度spider抓取新鏈接的途徑有兩個,一(yī)是主動出擊發現抓取,二就是從百度站長平台的鏈接提交工(gōng)具中(zhōng)獲取數據,其中(zhōng)通過主動推送功能“收”上來的數據最受百度spider的歡迎。對于站長來說,如果鏈接很長時間不被收錄,建議嘗試使用主動推送功能,尤其是新網站,主動推送首頁數據,有利于内頁數據的抓取。
那麽同學們要問了,爲什麽我(wǒ)(wǒ)提交了數據還是遲遲在線上看不到展現呢?那涉及的因素可就多了,在spider抓取這個環節,影響線上展現的因素有:
1、網站封禁。
你别笑,真的有同學一(yī)邊封禁着百度蜘蛛,一(yī)邊向百度狂交數據,結果當然是無法收錄。
2、質量篩選。
百度spider進入3.0後,對低質内容的識别上了一(yī)個新台階,尤其是時效性内容,從抓取這個環節就開(kāi)始進行質量評估篩選,過濾掉大(dà)量過度優化等頁面,從内部定期數據評估看,低質網頁比之前下(xià)降62%。
3、抓取失敗。
抓取失敗的原因很多,有時你在辦公室訪問完全沒有問題,百度spider卻遇到麻煩,站點要随時注意在不同時間地點保證網站的穩定性。
4、配額限制。
雖然我(wǒ)(wǒ)們正在逐步放(fàng)開(kāi)主動推送的抓取配額,但如果站點頁面數量突然爆發式增長,還是會影響到優質鏈接的抓取收錄,所以站點在保證訪問穩定外(wài),也要關注網站安全,防止被黑注入。