最近經(jīng)常收到一些SEO小白的私信,他們說自己去別的網(wǎng)站找了一些原創(chuàng)文字,然后自己處理對網(wǎng)站發(fā)布有影響,百度能鑒別出來嗎?
其實這個話題,我相信網(wǎng)絡是不一樣的,只是在這里一言以定的小編,想做網(wǎng)站原創(chuàng)內(nèi)容就沒有了。
今天小編就和大家聊聊百度原創(chuàng)內(nèi)容的相關(guān)信息。
建立最初的項目團隊,打一場持久戰(zhàn)
面對挑戰(zhàn),為了提升搜索引擎的用戶體驗,為了讓原創(chuàng)網(wǎng)站的優(yōu)質(zhì)原創(chuàng)創(chuàng)作者獲得應有的收益,為了推動中國互聯(lián)網(wǎng)的前進,我們部署了大量人員組成原創(chuàng)項目組:技術(shù)、產(chǎn)品、運營、法務等,這不是一個臨時的組織也不是一個1個月2個月的項目,我們準備打一場持久戰(zhàn)。
原始識別“原點”算法
互聯(lián)網(wǎng)上有數(shù)百億甚至數(shù)千億的網(wǎng)頁。
要從他們身上找到原創(chuàng)內(nèi)容,無異于大海撈針。
我們獨創(chuàng)的識別系統(tǒng),在百度大數(shù)據(jù)云計算平臺上進行,可以快速實現(xiàn)所有中文互聯(lián)網(wǎng)頁面的重復聚合和鏈接指向關(guān)系分析。
首先,利用內(nèi)容相似度聚合集合和原創(chuàng),將相似的網(wǎng)頁聚合在一起作為候選集進行原創(chuàng)識別;
其次,對于原始候選集,可以通過作者、發(fā)布時間、鏈接指向、用戶評論、原始情況的作者和站點歷史、轉(zhuǎn)發(fā)軌跡等數(shù)百個因素來識別原始頁面。
最后,通過價值分析系統(tǒng)對原創(chuàng)內(nèi)容的價值進行判斷,然后對最終的排名進行適當?shù)囊龑А?/p>
目前,通過我們的實驗和真實的在線數(shù)據(jù),“起源”算法已經(jīng)取得了一定的進展,解決了新聞信息領(lǐng)域的大部分問題。
當然,在其他領(lǐng)域還有更多的原創(chuàng)問題需要Origin來解決,我們正堅定地走在路上。
原始星火計劃
我們一直致力于原創(chuàng)內(nèi)容的識別和排序算法的調(diào)整,但在當前的互聯(lián)網(wǎng)環(huán)境下,快速識別原創(chuàng)內(nèi)容解決原創(chuàng)問題確實面臨著巨大的挑戰(zhàn),計算數(shù)據(jù)的規(guī)模、面對無窮無盡的采集方法、不同的網(wǎng)站建設方法和模板差別很大、內(nèi)容提取復雜等等。
這些因素會影響原有算法的識別,甚至導致判斷錯誤。
此時,百度和站長需要共同維護互聯(lián)網(wǎng)的生態(tài)環(huán)境,站長推薦原創(chuàng)內(nèi)容,搜索引擎通過一定的判斷后優(yōu)先對待原創(chuàng)內(nèi)容,共同推動生態(tài)的改善,鼓勵原創(chuàng),這就是“原創(chuàng)火花計劃”,旨在快速解決當前面臨的嚴重問題。
另外,站長對原創(chuàng)內(nèi)容的推薦,會應用到“原創(chuàng)”算法中,然后幫助百度發(fā)現(xiàn)算法的不足,不斷改進,用更智能的識別算法自動識別原創(chuàng)內(nèi)容。
目前,原創(chuàng)星火計劃也取得了初步成效,第一階段對一些重點原創(chuàng)新聞網(wǎng)站的原創(chuàng)內(nèi)容在百度搜索結(jié)果中給予了原創(chuàng)標記、作者顯示等,并且在排名和流量上也有了合理的提升。
綜上所述,無論百度算法如何變化,原創(chuàng)內(nèi)容絕對是未來的發(fā)展趨勢。
所以網(wǎng)站要想穩(wěn)定發(fā)展,就必須輸出高質(zhì)量的原創(chuàng)內(nèi)容。
百度肯定會推薦更多原創(chuàng)內(nèi)容,如果處理過的文章比較火,一篇文章經(jīng)過不同站長的處理,那么百度如何提升用戶體驗?