為了SEO優(yōu)化的發(fā)展,自己辛辛苦苦寫(xiě)了兩篇原創(chuàng)文章,沒(méi)想到被一個(gè)大型企業(yè)網(wǎng)站抄襲秒收錄,而自己的站點(diǎn)卻沒(méi)被收錄,這是一件讓人有點(diǎn)尷尬的事情,那么真的不收錄,就不是原創(chuàng)了嗎?
未收錄不代表未抓取
很多站長(zhǎng)朋友是這樣認(rèn)為的,自己的文章沒(méi)有被收錄,而抄襲者的卻收錄了,所以百度判斷自己抄襲了別人的文章,自己的權(quán)重也就一直上不來(lái),沒(méi)有排名。
其實(shí)這是一個(gè)錯(cuò)誤的觀點(diǎn),我曾在百度排名規(guī)則的文章中提到,百度收錄是需要經(jīng)過(guò)抓取-識(shí)別-釋放這三個(gè)流程。其中在釋放的流程中,需要判斷整體網(wǎng)站的質(zhì)量,當(dāng)整體網(wǎng)站質(zhì)量過(guò)關(guān),收錄相對(duì)較快,當(dāng)整體網(wǎng)站信譽(yù)度沒(méi)有達(dá)到百度的標(biāo)準(zhǔn),百度將會(huì)暫時(shí)保留你的文章,不釋放出來(lái)。
雖然不被釋放出來(lái),但是已經(jīng)經(jīng)過(guò)了抓取和識(shí)別這兩個(gè)流程。
在這里特別的說(shuō)一下抓取的流程,當(dāng)網(wǎng)站建立以后,提交到搜索引擎,搜索引擎基本每天都會(huì)來(lái)抓取,大家可以試著安裝百度云加速后臺(tái)可以統(tǒng)計(jì)出抓取的頁(yè)面,如果抓取不夠,也可以在百度站長(zhǎng)平臺(tái)中設(shè)置抓取頻率和sitemap自動(dòng)推送,這樣抓取的是完全沒(méi)有壓力。設(shè)置方法網(wǎng)上有很多介紹,大家可以自己找一下。
如何判斷文章的原創(chuàng)度?
并不是你網(wǎng)站有文章,是你自己寫(xiě)的,就一定會(huì)被搜索引擎認(rèn)為這是一篇原創(chuàng)文章,因?yàn)槠渲羞€有很多技術(shù)方面的問(wèn)題,搜索引擎還未能解決。
觀瀾網(wǎng)站制作優(yōu)化人員曾經(jīng)在一個(gè)網(wǎng)站每天更新一篇文章,一篇文章的字?jǐn)?shù)只有100字左右,但是文章頁(yè)面非常簡(jiǎn)單,簡(jiǎn)單到整個(gè)頁(yè)面沒(méi)有JS、CSS、HTML代碼,只有文字,但收錄卻非常好,而有一些網(wǎng)站,用JS、CSS、html代碼把網(wǎng)站修飾的非常漂亮,但是發(fā)布的文章卻不收錄,這讓我們覺(jué)得代碼與原創(chuàng)度有直接關(guān)系。
在哪里看到過(guò)這樣的一句話(huà)“搜索引擎只能識(shí)別200KB以?xún)?nèi)的內(nèi)容”,對(duì)于一個(gè)網(wǎng)站而言,200KB算是很大了,我的博客只有30KB左右,所以我博客在搜索引擎中抓取是完全沒(méi)有壓力,如果你的網(wǎng)站有超過(guò)200KB,我覺(jué)得你是應(yīng)該要優(yōu)化了。
這和網(wǎng)站的文件大小有什么關(guān)系呢?我們來(lái)看看,搜索引擎在抓取一個(gè)頁(yè)面的流程是從頭到底,任何一個(gè)頁(yè)面都有一個(gè)共同點(diǎn),那就是頭部一樣、底部一樣,唯一不一樣的就是文章內(nèi)容,那么搜索引擎在抓取頭部有10KB左右是一模一樣的,到中部文字的時(shí)候只有2KB是不一樣的,而底部又有10KB是一模一樣的,那么還會(huì)認(rèn)為這是原創(chuàng)文章嗎?
其實(shí)搜索引擎是不認(rèn)識(shí)字的,他只有把這個(gè)漢字放到他的數(shù)據(jù)庫(kù)去對(duì)比,當(dāng)一對(duì)比一個(gè)新文章頁(yè)面的時(shí)候,總共22KB的頁(yè)面,居然有20KB一模一樣,就算是寫(xiě)了原創(chuàng)文章,也會(huì)被認(rèn)為是偽原創(chuàng)。
防止抄襲最好的辦法
什么禁止右鍵、禁止復(fù)制這些方法都弱爆了,對(duì)方要抄襲、要采集,這點(diǎn)技術(shù)禁止,是完全沒(méi)有作用,況且人家采集是直接從代碼中采集,并非實(shí)際來(lái)到了你的網(wǎng)站,而且還會(huì)影響用戶(hù)體驗(yàn)度,所以不建議使用這些方法來(lái)禁止抄襲者。
當(dāng)我今天把文章寫(xiě)出來(lái)后,不管是否收錄明天將會(huì)把文章通過(guò)投稿的形式發(fā)布出去,通過(guò)投稿的形式,對(duì)方會(huì)完全的尊重并且保留你的版權(quán),即使沒(méi)有留下鏈接版權(quán),至少也會(huì)留下品牌詞的版權(quán)。
投稿成功以后,當(dāng)抄襲者在此抄襲這篇文章的時(shí)候,互聯(lián)網(wǎng)已經(jīng)有很多此文章了,第一他會(huì)覺(jué)得互聯(lián)網(wǎng)文章太多,不會(huì)再次抄襲了,因?yàn)樗氤瓌?chuàng)文章,第二就算他抄襲了,互聯(lián)網(wǎng)你投了這么多文章,最終公認(rèn)的版權(quán)是你的,并且多個(gè)頁(yè)面有URL直接指向你的頁(yè)面,這也是給你這篇文章做了一個(gè)最好的外鏈。
為什么抄襲者的網(wǎng)站更容易收錄?
那么還有一個(gè)問(wèn)題來(lái)了,既然要抓取、識(shí)別、釋放這么復(fù)雜的流程,為何抄襲我們網(wǎng)站的內(nèi)容還先收錄呢?
在談?wù)摮u者網(wǎng)站為何會(huì)收錄塊的時(shí)候,我覺(jué)得咱們先要搞清楚新聞內(nèi)容是收錄流程,新聞內(nèi)容相對(duì)普通的內(nèi)容收錄較快,因?yàn)樾侣剝?nèi)容具有時(shí)效性,所以必須當(dāng)場(chǎng)發(fā)當(dāng)場(chǎng)收錄,然后釋放出來(lái),不然拖到第二天在收錄的話(huà),這個(gè)新聞可能不熱了,關(guān)注的人也就少了,百度從而失去了這個(gè)體驗(yàn)。
而抄襲者的網(wǎng)站與新聞內(nèi)容類(lèi)似,通常抄襲者的網(wǎng)站是抄襲過(guò)多篇文章,其中有直接抄襲原創(chuàng)者,也就抄襲二手文章,抄來(lái)抄去,互聯(lián)網(wǎng)同樣的文章就非常多了,當(dāng)一篇文章被互聯(lián)網(wǎng)多次抄襲,這就意味著這篇文章比較熱門(mén),不熱門(mén)怎么會(huì)這么多人抄襲呢?最終就出現(xiàn)了一個(gè)熱點(diǎn)效應(yīng),收錄的門(mén)檻也就降低了。所以就出現(xiàn)了抄襲者抄襲了你的文章,比你還先收錄。