如果網(wǎng)站使用虛擬空間,就會有一些流量限制。如果大部分流量被蜘蛛占據(jù),我們需要花一些額外的錢來購買流量。那么,如果一個網(wǎng)站上的大量流量被蜘蛛爬行浪費,有什么技能和方法可以限制搜索引擎優(yōu)化效果而不影響搜索引擎的優(yōu)化效果呢?企業(yè)推動seo顧問認(rèn)為我們可以采取以下方法:
1、找出假蜘蛛和盾牌IP。通過對網(wǎng)站日志的分析,我們可以知道許多所謂的百度蜘蛛或谷歌蜘蛛實際上是假的。我們可以分析這些假蜘蛛IP屏蔽它們不僅可以節(jié)省流量,還可以降低網(wǎng)站收集的風(fēng)險。需要檢查具體操作ip是否是真正的蜘蛛,操作方法是:點擊左下角start-run-cmd-enter命令可以看到結(jié)果。如果是真的,搜索蜘蛛有蜘蛛標(biāo)記,但假蜘蛛沒有標(biāo)記。
2、屏蔽無效蜘蛛或搜索蜘蛛對搜索引擎優(yōu)化影響不大。例如,我們知道google蜘蛛是一種很大的抓取量,但對許多行業(yè)來說,google流量很低,seo效果不好,可以屏蔽google蜘蛛的抓取并節(jié)省很多流量,比如說網(wǎng)站屏蔽了抓取量。谷歌蜘蛛。除了谷歌,還有一些蜘蛛,如谷歌搜索、必應(yīng)蜘蛛等。這些流量很低,或者幾乎沒有蜘蛛能真正躲開。
3、使用robots.txt限制無效或重復(fù)頁面的爬網(wǎng)。有些頁面以前可能存在,但現(xiàn)在不存在,或動態(tài)和靜態(tài)URL。蜘蛛仍然會不時地抓住它們,因為數(shù)據(jù)庫中有反向鏈接或此類鏈接。我們可以找到返回404頁的鏈接url并屏蔽,從而改進抓取,屏蔽也減少了對流量的浪費。
限制蜘蛛抓取頁數(shù)
4、限制頁面爬行內(nèi)容,提高爬行效率和速度,減少爬行流量。對于任何頁面,都有許多無效的噪聲區(qū)域,如網(wǎng)站登錄、注冊部分、底部版權(quán)信息、一些有用的鏈接導(dǎo)航等,或者一些模板上的蜘蛛無法識別的顯示模塊,我們可以使用這些模板添加nofollow標(biāo)簽。
5、外部鏈接或CDN加速,以改善蜘蛛捕獲,減少服務(wù)器響應(yīng)和流量浪費。目前,大多數(shù)網(wǎng)站使用大量的圖片、視頻和其他多媒體來顯示,但這些圖片缺乏更多的下載流量。如果我們使用外部調(diào)用圖片,我們可以節(jié)省大量的蜘蛛爬行流量。目前,更好的方法是將圖片放在其他服務(wù)器上或上傳到一些磁盤上。
6、使用站長工具限制或改進蜘蛛抓取,或限制蜘蛛抓取時間。目前,百度站長平臺和谷歌站長平臺都有站長抓取工具,可以用來限制蜘蛛抓取的時間和數(shù)量。我們可以根據(jù)需要合理部署,取得更好的效果。
當(dāng)然,在實踐中,我們也可以根據(jù)自己的實際需要來解決這個問題,比如對于一些抓取量過大的欄目,在網(wǎng)站地圖上設(shè)置較低的抓取頻率,如果不包含一些重要的內(nèi)容,可以增加外部或內(nèi)部鏈來提高抓取效率等。該方法已失效,可根據(jù)具體情況進行改進。為了降低和提高抓取效率,更新期間的設(shè)置需要合理化。