亚洲va国产日韩欧美精品色婷婷,国产精品一区二区三区免费,国产美女做爰免费视,伊人久久久综在合线久久在播

企億推信息網(wǎng)
專注網(wǎng)絡(luò)推廣服務(wù)

百度蜘蛛怎么識(shí)別?Baiduspider的真假呢?

事實(shí)上,我們?nèi)罩局械脑S多百度Pider都是被別人偽裝的。來(lái)解決這個(gè)問(wèn)題。我們必須努力驗(yàn)證百度pider的真實(shí)性。本文詳細(xì)介紹了爬蟲(chóng)的識(shí)別方法

當(dāng)我們根據(jù)網(wǎng)站日志分析搜索引擎蜘蛛捕獲的網(wǎng)頁(yè)記錄時(shí),實(shí)際上很多網(wǎng)站都有一些偽裝成百度pider的訪問(wèn)者。這些數(shù)據(jù)將嚴(yán)重影響我們?cè)谌罩痉治龊蟮呐袛?/p>

為什么這些訪問(wèn)者假裝是百度皮德?tīng)杹?lái)訪問(wèn)我們的網(wǎng)站?最典型的是那些收集你的內(nèi)容的人。他們知道,許多工具可以看到哪些IP訪問(wèn)網(wǎng)站太大。例如,今天IP訪問(wèn)你的網(wǎng)站10000次是否正常?一定是不正常。但如果他是百度pdier呢?呵呵,這很正常

Mozilla/5.0(兼容;Baiduspider/2.0;+http://www.baidu.com/search/spider.html)

Mozilla/5.0(兼容;Baiduspider渲染/2.0;+http://www.baidu.com/search/spider.html)

Mozilla/5.0(Linux;u;Android4.2.2;zhcn;)AppleWebKit/534.46(KHTML,likeGecko)版本/5.1MobileSafari/10600.6.3(兼容;Baiduspider/2.0;+http://www.baidu.com/search/spider.html)

Mozilla/5.0(iPhone;CPUiPhoneOS9_1likeMacOSX)AppleWebKit/601.1.46(KHTML,likeGecko)版本/9.0Mobile/13B143Safari/601.1(兼容;Baiduspiderrender/2.0;+http://www.baidu.com/search/spider.html)

以上包括百度的常規(guī)爬蟲(chóng)和渲染爬蟲(chóng)渲染。這兩種爬行動(dòng)物的區(qū)別特征用紅色標(biāo)記

這個(gè)問(wèn)題可以通過(guò)DNS反向查找解決。不同平臺(tái)的驗(yàn)證方法不同。例如,linux/Windows/OS下的驗(yàn)證方法如下:

百度蜘蛛怎么識(shí)別?Baiduspider的真假呢?
(圖1)

1。在Linux平臺(tái)上,可以使用hostip命令反轉(zhuǎn)IP,以確定抓取是否來(lái)自Baiduspider。Baiduspider的主機(jī)名在百度。Com或百度。JP格式命名,非百度。Com或百度。JP是假的

2。在windows或ibmos/2平臺(tái)上,可以使用nslookupip命令反轉(zhuǎn)IP,以確定抓取是否來(lái)自Baiduspider。打開(kāi)命令處理器并輸入nslookupxxxxxx。xxx。XXX(IP地址)可以解析IP以確定它是否是從Baiduspider獲取的。Baiduspider的主機(jī)名用百度表示。Com或百度。JP格式命名,非百度。Com或百度。JP是假的

3。在MacOS平臺(tái)上,可以使用dig命令反轉(zhuǎn)IP地址,以確定抓取是否來(lái)自Baiduspider。打開(kāi)命令處理器并輸入digxxx。xxx。XXX(IP地址)可以解析IP以確定它是否是從Baiduspider獲取的。Baiduspider的主機(jī)名用百度表示。Com或百度。JP格式命名,非百度。Com或百度。JP是假的。

未經(jīng)允許不得轉(zhuǎn)載:啟新網(wǎng)站SEO優(yōu)化 » 百度蜘蛛怎么識(shí)別?Baiduspider的真假呢?
分享到: 更多 (0)
加載中~