掃描二維碼關(guān)注博盈官方微信公眾號(hào)
立享網(wǎng)站建設(shè)優(yōu)惠
做SEO離不開內(nèi)容,沒(méi)有內(nèi)容就沒(méi)有收錄,沒(méi)有收錄也就沒(méi)有排名,應(yīng)該說(shuō),解決內(nèi)容的問(wèn)題是很多站長(zhǎng)和SEO所頭疼的,一定程度上來(lái)說(shuō)比做外鏈還困難,尤其是遇到專業(yè)不對(duì)口,行業(yè)不熟悉的文案書寫的時(shí)候,內(nèi)容簡(jiǎn)直讓SEO想要發(fā)瘋,因?yàn)閮?nèi)容我不禁感慨,做SEO的真?zhèn)黄稹?
好,新手站長(zhǎng)和菜鳥SEO想到內(nèi)容這么難搞?我為什么不覺(jué)得,網(wǎng)上那么多精彩的文章,轉(zhuǎn)載過(guò)來(lái)不就得了?這是最直接最想當(dāng)然的方法,然而這樣的做法最終導(dǎo)致的結(jié)果是你的網(wǎng)站充滿大量的復(fù)制內(nèi)容,毫無(wú)新意,對(duì)搜索引擎來(lái)說(shuō),一個(gè)新站一開始就充滿大量這樣的內(nèi)容,基本上就宣布你的網(wǎng)站SEO工作失敗。關(guān)于復(fù)制內(nèi)容對(duì)SEO到底有什么樣的影響,如何產(chǎn)生,如何避免,這是本篇文章所要談到的話題,希望能給新手帶去一些警示。
什么叫復(fù)制內(nèi)容?復(fù)制內(nèi)容如何產(chǎn)生的?
復(fù)制內(nèi)容也被叫做重復(fù)內(nèi)容,理論上的定義是指兩個(gè)以上的URL內(nèi)容一樣或者相似度極高,這樣的URL可能是一個(gè)網(wǎng)站,更多的是發(fā)生在不同的網(wǎng)站里面。關(guān)于產(chǎn)生復(fù)制內(nèi)容的原因,有必要做個(gè)簡(jiǎn)單介紹,這樣SEO在工作的時(shí)候才能知道如何避免,如下:
1、技術(shù)原因。網(wǎng)站網(wǎng)址URL不規(guī)范,未作標(biāo)準(zhǔn)化的問(wèn)題會(huì)讓一個(gè)網(wǎng)站內(nèi)部產(chǎn)生大量復(fù)制內(nèi)容,幾乎每篇內(nèi)容都會(huì)存在兩篇以上的重復(fù)。
2、企業(yè)站產(chǎn)品站。給成都紅土地畫室做SEO顧問(wèn)時(shí)這樣的感覺(jué)最明顯,不同地區(qū)看到的URL不一樣,當(dāng)是服務(wù)內(nèi)容除了價(jià)格幾乎完全一樣。對(duì)產(chǎn)品站來(lái)說(shuō),代理商或者零售商往往都直接從生產(chǎn)商將產(chǎn)品信息原封不動(dòng)的轉(zhuǎn)載過(guò)來(lái),我們討論的不是版權(quán)問(wèn)題,也沒(méi)什么不正確的。問(wèn)題是大部分代理、零售都會(huì)直接復(fù)制,除了聯(lián)系方式其他內(nèi)容很少改動(dòng),在這些網(wǎng)站上充斥著大量重復(fù)內(nèi)容,這些內(nèi)容重復(fù)度極高!對(duì)SEO造成很大的影響。
3、網(wǎng)站結(jié)構(gòu)。是的,在大量的產(chǎn)品網(wǎng)站中根據(jù)產(chǎn)品的價(jià)格、上傳時(shí)間、區(qū)間、評(píng)論等等因素進(jìn)行排序的頁(yè)面,相同產(chǎn)品都有不同的URL,造成至少三四個(gè)頁(yè)面的重復(fù)。在博客中表現(xiàn)得很明顯的是時(shí)間及分類存檔,這些網(wǎng)站結(jié)構(gòu)造成了各種頁(yè)面版本,形成大量站內(nèi)重復(fù)內(nèi)容。
4、新聞?lì)惥W(wǎng)站。我朋友以前做一個(gè)新聞網(wǎng)站,直接用RSS生成他需要的內(nèi)容,這讓他覺(jué)得自豪,因?yàn)椴挥枚啻蠊Ψ蚓湍塬@得完整時(shí)效的新聞。然而這些新聞內(nèi)容已經(jīng)在原文和其他網(wǎng)站上早出現(xiàn)上百次了,最后網(wǎng)站基本上沒(méi)收錄,宣布夭折。
5、網(wǎng)頁(yè)內(nèi)容少。在網(wǎng)站上都會(huì)有很大一部分的通用內(nèi)容,比如廣告、版權(quán)聲明、說(shuō)明文字、上下導(dǎo)航條等等。網(wǎng)頁(yè)的正文太少,會(huì)使得搜索引擎看起來(lái)這些網(wǎng)頁(yè)都是重復(fù)度很高的頁(yè)面。
6、轉(zhuǎn)載和抄襲。這應(yīng)該是SEO行業(yè)內(nèi)造成當(dāng)前海量復(fù)制內(nèi)容的最主要原因。各種轉(zhuǎn)載,各種剽竊,還有鏡像網(wǎng)站,采集等等。對(duì)于這一點(diǎn)沒(méi)說(shuō)明好說(shuō)的,只是希望行業(yè)內(nèi)的人士都應(yīng)該具有版權(quán)意識(shí)。
7、http狀態(tài)碼問(wèn)題。我舉例說(shuō)明,一個(gè)用phpwind論壇程序做的論壇,一個(gè)具體帖子URL是http://www.boryin.com,如果不做技術(shù)處理,tid后面的數(shù)字換成任意的上千上萬(wàn)比如100000,服務(wù)器依然返回200狀態(tài)碼,與原來(lái)的tid=137內(nèi)容一樣,這點(diǎn)會(huì)造成恐怖的站內(nèi)重復(fù)內(nèi)容。菜鳥一定要注意。
既然產(chǎn)生復(fù)制內(nèi)容的因素這么多,那么我們平時(shí)應(yīng)該如何檢查手中的內(nèi)容是否有復(fù)制版本呢?很簡(jiǎn)單,拿正文中較前面的一段話,加上雙引號(hào)直接百度索索,從搜索引擎結(jié)果中就可以直觀的發(fā)現(xiàn)文章的重復(fù)度。舉例我曾經(jīng)在A5寫過(guò)一篇“初中畢業(yè)生SEO創(chuàng)業(yè)經(jīng)歷 鼓舞那些仍在彷徨的菜鳥”,標(biāo)題的組合在A5發(fā)布之前是沒(méi)有命中結(jié)果的,現(xiàn)在在谷歌搜索有將近1000個(gè)頁(yè)面,不過(guò)令人遺憾的是,絕大部分的轉(zhuǎn)載者沒(méi)有遵守版權(quán),有的甚至將作者名稱都已經(jīng)換掉了……
復(fù)制內(nèi)容有什么樣的害處?
這是我極力想告訴新手站長(zhǎng)和菜鳥SEO人員的,因?yàn)槲覔?dān)心你們一開始為圖方便快捷而大量轉(zhuǎn)載,仔細(xì)看完下面的講解,你一定不愿意讓自己的網(wǎng)站剛建立起來(lái)就去復(fù)制轉(zhuǎn)載了。
首先要澄清一個(gè)誤解,可能不少新人也會(huì)這樣理解:網(wǎng)站上充斥著復(fù)制內(nèi)容就會(huì)受到搜索引擎的懲罰。正確的理解是:搜索引擎絕不不可能因?yàn)槲覀兙W(wǎng)站有部分復(fù)制內(nèi)容就處理我們,它應(yīng)該做的事情是從多個(gè)這樣的內(nèi)容版本中識(shí)別出最原始出處,然后給定排名,而復(fù)制版本往往排名靠后,或者隨著時(shí)間將被剔除,以致沒(méi)有排名。但要記住,巨無(wú)霸級(jí)別的網(wǎng)站不在此列。
目前搜索引擎在判斷原創(chuàng)的時(shí)候失誤率也算比較高的,很多站長(zhǎng)對(duì)此感到無(wú)奈,辛辛苦苦做的原創(chuàng)被別人剽竊發(fā)到其他網(wǎng)站,轉(zhuǎn)瞬之間被收錄,而自己網(wǎng)站上的原創(chuàng)頁(yè)面看起來(lái)就像是受到懲罰了,因?yàn)樗阉饕媾袛嘣瓌?chuàng)失敗,沒(méi)有給予我們應(yīng)有的分?jǐn)?shù)。
復(fù)制內(nèi)容的另一個(gè)害處,站內(nèi)出現(xiàn)重復(fù)還算嚴(yán)重,存在的問(wèn)題是站長(zhǎng)做優(yōu)化和鏈接時(shí)容易被分散精力,并且搜索引擎認(rèn)為最適合的URL可能與你想想的不一樣,這是一種成本浪費(fèi)。同一個(gè)網(wǎng)站內(nèi)充斥著的重復(fù)內(nèi)容也會(huì)分散權(quán)重,造成不必要的內(nèi)部競(jìng)爭(zhēng),在外看來(lái),失去了最佳的排名機(jī)會(huì),同時(shí)擠掉其他頁(yè)面被收錄的機(jī)會(huì)。
如果網(wǎng)站上充滿70%以上的其他網(wǎng)站重復(fù)內(nèi)容,會(huì)引起搜索引擎的注意,他們會(huì)懷疑網(wǎng)站的質(zhì)量,從而導(dǎo)致懲罰,最開始從快照與收錄開始體現(xiàn),接著會(huì)降低關(guān)鍵詞排名、刪除已經(jīng)收錄頁(yè)面到最后拔毛都是很可能的。我在A5寫過(guò)一篇:“淺談網(wǎng)站采集與偽原創(chuàng)這條不歸路”,點(diǎn)擊率非常高,因此我可以斷言,站長(zhǎng)內(nèi)心是知道重復(fù)內(nèi)容的害處的,只是依然“無(wú)可奈何”。
接下來(lái)我們要考慮的是如何消除重復(fù)內(nèi)容。
針對(duì)我上面例舉的產(chǎn)生復(fù)制內(nèi)容的原因,站長(zhǎng)和新手SEO可以逐條修改避免,例如網(wǎng)址規(guī)范化的問(wèn)題都可以通過(guò)技術(shù)手段解決。而不是網(wǎng)址規(guī)范化引起的重復(fù)內(nèi)容問(wèn)題,可以對(duì)已經(jīng)收錄的重復(fù)頁(yè)面左301,或者通過(guò)書寫robots.txt文件通配符只保證一種版本被收錄。還可以在具體頁(yè)面天劍noindex(不希望被索引)這個(gè)meta robots標(biāo)簽。對(duì)于不希望收錄的重復(fù)頁(yè)面鏈接還要添加上nofollow。
解決產(chǎn)品站的復(fù)制內(nèi)容有一個(gè)比較好用的方法。這個(gè)方法是我在zac前輩的seo實(shí)戰(zhàn)密碼之中學(xué)習(xí)到的,那就是使用canonical標(biāo)簽。比如一個(gè)賣衣服的網(wǎng)站,同一種格調(diào)的衣服可能有不同的尺寸,尺寸之間的區(qū)別就是顏色,這樣同一個(gè)尺寸的衣服會(huì)因?yàn)轭伾a(chǎn)生多個(gè)網(wǎng)址,內(nèi)容卻幾乎完全一樣。這個(gè)時(shí)候如果使canonical,用戶在瀏覽器得到的頁(yè)面不會(huì)轉(zhuǎn)向,看到的頁(yè)面雖然還是會(huì)不同,但搜索引擎會(huì)將權(quán)重集中到一個(gè)尺寸上,這樣整體避免重復(fù)內(nèi)容。不過(guò)令人遺憾的是,百度似乎不支持這個(gè)標(biāo)簽。
網(wǎng)站要解決復(fù)制內(nèi)容其實(shí)是非常麻煩的,因?yàn)槟憧梢钥刂谱约旱木W(wǎng)站,但你無(wú)法控制互聯(lián)網(wǎng)上的其他網(wǎng)站,對(duì)于SEO來(lái)說(shuō),我們只能做到下面兩點(diǎn):
1、在自己的原創(chuàng)內(nèi)容之中加入版權(quán)聲明,要求轉(zhuǎn)載保留指向原始頁(yè)面的鏈接,原創(chuàng)版本的外部鏈接應(yīng)該會(huì)比轉(zhuǎn)載的多,對(duì)目前的搜索引擎技術(shù)來(lái)說(shuō),這是最重要的判斷信息了!
2、堅(jiān)持原創(chuàng),網(wǎng)站堅(jiān)持原創(chuàng),好處巨大,只要能夠堅(jiān)持一定的時(shí)間,網(wǎng)站的權(quán)重必定增加,加上網(wǎng)站良好的獨(dú)特內(nèi)容給搜索引擎留下的深刻印象,網(wǎng)站之中的內(nèi)容被判斷為原創(chuàng)的機(jī)會(huì)大大增加。
如果經(jīng)過(guò)以上辦法,SEO和站長(zhǎng)依然無(wú)法解決復(fù)制的問(wèn)題,甚至發(fā)現(xiàn)有網(wǎng)站大量抄襲你的內(nèi)容,造成原創(chuàng)內(nèi)容全部失效,你也可以主動(dòng)的去和對(duì)方接洽,通過(guò)各種手段,比如交際=投訴到空間商、甚至向搜索引擎投訴,在比較不重視版權(quán)的中文互聯(lián)網(wǎng)環(huán)境之中,這的確是非常棘手的問(wèn)題。無(wú)論如何,真心希望我們的行業(yè)越來(lái)越走向規(guī)范化。關(guān)于復(fù)制內(nèi)容,你是否了解足夠了呢?