搜索引擎每天都會(huì)對(duì)數(shù)以萬(wàn)計(jì)的URL進(jìn)行爬網(wǎng)。他們通過相互聯(lián)系形成了我們現(xiàn)有的互聯(lián)網(wǎng)關(guān)系。對(duì)于SEO人員,我們經(jīng)常談?wù)撘粋€(gè)術(shù)語(yǔ):網(wǎng)站爬網(wǎng)頻率
它在SEO的日常工作中起著重要作用,并為網(wǎng)站優(yōu)化提供了有價(jià)值的建議
根據(jù)以往的工作經(jīng)驗(yàn),我們知道網(wǎng)頁(yè)收集的一個(gè)基本過程主要是:
URL捕獲-&;燃?xì)廨啓C(jī);內(nèi)容質(zhì)量評(píng)估-&;燃?xì)廨啓C(jī);索引庫(kù)篩選器-&;燃?xì)廨啓C(jī);網(wǎng)頁(yè)收藏(在搜索結(jié)果中顯示)
如果您的內(nèi)容質(zhì)量相對(duì)較低,則會(huì)直接放入低質(zhì)量的索引庫(kù),因此很難被百度收錄。從這個(gè)過程中不難看出,網(wǎng)站捕獲頻率將直接影響網(wǎng)站的收集率和內(nèi)容質(zhì)量評(píng)價(jià)
影響網(wǎng)站爬行頻率的因素:
入站鏈接:理論上,只要是外鏈,無(wú)論其質(zhì)量和形狀如何,它將起到引導(dǎo)蜘蛛爬行和爬行的作用
網(wǎng)站結(jié)構(gòu):網(wǎng)站建設(shè)首選短域名,簡(jiǎn)化目錄層次結(jié)構(gòu),避免過長(zhǎng)URL和太多動(dòng)態(tài)參數(shù)
頁(yè)面速度:百度多次提到移動(dòng)優(yōu)先級(jí)索引,重要指標(biāo)是頁(yè)面的初始加載,控制在3秒內(nèi)
主動(dòng)提交:網(wǎng)站地圖、官方API提交、JS訪問提交等
內(nèi)容更新:高質(zhì)量?jī)?nèi)容的更新頻率是大型網(wǎng)站排名的核心因素
百度熊掌:如果你的網(wǎng)站配置了熊掌,在內(nèi)容足夠高的前提下,捕獲率幾乎達(dá)到
如何查看網(wǎng)站爬網(wǎng)頻率:
CMS系統(tǒng)的“百度蜘蛛”分析插件
定期進(jìn)行“網(wǎng)站日志分析”比較方便
頁(yè)面爬網(wǎng)對(duì)網(wǎng)站的影響:
網(wǎng)站修訂
如果您的網(wǎng)站進(jìn)行了升級(jí)和修訂,并且一些URL被修改,可能迫切需要搜索引擎抓取和重新評(píng)估頁(yè)面內(nèi)容
事實(shí)上,此時(shí)有一個(gè)方便的竅門:即主動(dòng)將URL添加到站點(diǎn)地圖,在百度的后臺(tái)進(jìn)行更新,并將其更改通知搜索引擎
網(wǎng)站排名
大多數(shù)站長(zhǎng)認(rèn)為,自百度熊掌上線以來(lái),它解決了收錄問題。事實(shí)上,只有當(dāng)目標(biāo)URL不斷被捕獲時(shí),它才能不斷重新評(píng)估其權(quán)重并提高其排名
因此,當(dāng)您有一個(gè)頁(yè)面需要參與排名時(shí),有必要將其放在捕獲頻率較高的列中
壓力控制
頁(yè)面爬行頻率高并不一定好。它來(lái)自惡意收集爬蟲,往往會(huì)造成服務(wù)器資源的嚴(yán)重浪費(fèi)甚至停機(jī),尤其是一些外部鏈分析爬蟲
如有必要,可能需要合理使用robotsTxt進(jìn)行有效屏蔽
異常診斷
如果你發(fā)現(xiàn)一個(gè)頁(yè)面長(zhǎng)時(shí)間沒有被收錄,有必要了解百度蜘蛛的可訪問性。你可以通過百度官方背景爬網(wǎng)診斷來(lái)查看具體原因。