當(dāng)前位置:首頁(yè) >  站長(zhǎng) >  搜索優(yōu)化 >  正文

SEO如何減少網(wǎng)站復(fù)制重復(fù)內(nèi)容過(guò)多的問(wèn)題?

 2020-10-14 14:26  來(lái)源: A5專(zhuān)欄   我來(lái)投稿 撤稿糾錯(cuò)

  域名預(yù)訂/競(jìng)價(jià),好“米”不錯(cuò)過(guò)

復(fù)制內(nèi)容也可以稱(chēng)為重復(fù)內(nèi)容。復(fù)制內(nèi)容指的是兩個(gè)或多個(gè)URL內(nèi)容相同,或非常相似。復(fù)制內(nèi)容既可能發(fā)生在同一個(gè)網(wǎng)站內(nèi),也可能發(fā)生在不同網(wǎng)站上。

1、產(chǎn)生復(fù)制內(nèi)容的原因

下面這些原因可能造成復(fù)制內(nèi)容。曾慶平SEO前面討論的網(wǎng)址規(guī)范化問(wèn)題會(huì)產(chǎn)生復(fù)制內(nèi)容。

代理商和零售商從產(chǎn)品生產(chǎn)商那里轉(zhuǎn)載產(chǎn)品信息。這倒沒(méi)什么不對(duì),一般生產(chǎn)商也都同意,沒(méi)有版權(quán)問(wèn)題。但是絕大部分代理商、零售商、批發(fā)商都是直接copy而不做任何改動(dòng),大家用的都是一模一樣的產(chǎn)品說(shuō)明,所以這些電子商務(wù)網(wǎng)站上充斥著大量復(fù)制內(nèi)容。

打印版本。很多網(wǎng)站除了正常供瀏覽的頁(yè)面外,還提供更適于打印的頁(yè)面版本,如果沒(méi)有用適當(dāng)方式禁止抓取,這些打印版本網(wǎng)頁(yè)就會(huì)變成復(fù)制內(nèi)容。

網(wǎng)站結(jié)構(gòu)造成的各種頁(yè)面版本。如產(chǎn)品列表按價(jià)格、評(píng)論、上架時(shí)間等排序頁(yè)面,博客的分類(lèi)存檔、時(shí)間存檔等。

網(wǎng)頁(yè)內(nèi)容由RSS生成。有很多網(wǎng)站,尤其是新聞?lì)惥W(wǎng)站,用其他網(wǎng)站的 RSS feed 生成網(wǎng)站內(nèi)容,這些內(nèi)容在原始出處和很多其他類(lèi)似網(wǎng)站上都已經(jīng)出現(xiàn)過(guò)很多次了。

使用Session ID。搜索引擎蜘蛛在不同時(shí)間訪(fǎng)問(wèn)網(wǎng)頁(yè)的時(shí)候,被給予了不同的Session ID,實(shí)際上網(wǎng)頁(yè)內(nèi)容是一樣的。由于Session 1D參數(shù)不同,就被當(dāng)成了不同的網(wǎng)頁(yè)。

網(wǎng)頁(yè)實(shí)質(zhì)內(nèi)容太少。每個(gè)網(wǎng)頁(yè)上都不可避免地有通用部分,比如:導(dǎo)航條、版權(quán)聲明、廣告等。如果網(wǎng)頁(yè)的正文部分太短,內(nèi)容數(shù)量還抵不上通用部分,就有可能被認(rèn)為是復(fù)制內(nèi)容頁(yè)面。

轉(zhuǎn)載及抄襲。有時(shí)是其他人抄襲了你的網(wǎng)站內(nèi)容,有時(shí)是善意的轉(zhuǎn)載,有時(shí)是作者自己在不同網(wǎng)站發(fā)布文章,這些都會(huì)造成復(fù)制內(nèi)容。

鏡象網(wǎng)站。鏡象網(wǎng)站曾經(jīng)很流行,當(dāng)一個(gè)網(wǎng)站太忙太慢的時(shí)候,用戶(hù)可以通過(guò)替代鏡象來(lái)看內(nèi)容或下載,這也有造成復(fù)制內(nèi)容的風(fēng)險(xiǎn)。

產(chǎn)品或服務(wù)類(lèi)型之間的區(qū)別比較小。比如有的網(wǎng)站把自己的服務(wù)按地區(qū)進(jìn)行分類(lèi),但實(shí)際上提供給每個(gè)地區(qū)的產(chǎn)品或服務(wù)都是一樣的。這些按地區(qū)分類(lèi)的頁(yè)面只是把地名改了改,其他服務(wù)內(nèi)容說(shuō)明全都一樣。 URL任意加字符還是返回200狀態(tài)碼。有的網(wǎng)站由于技術(shù)原因,用戶(hù)在URL后加上任意字符或參數(shù),服務(wù)器還能正常返回200狀態(tài)碼,并返回沒(méi)加上任意字符時(shí)一樣的重復(fù)內(nèi)容頁(yè)面。

檢查頁(yè)面是否有復(fù)制版本相對(duì)簡(jiǎn)單。拿出頁(yè)面正文中的一句話(huà),加上雙引號(hào),在搜索引擎中搜索一下,從結(jié)果中就能看到是否有多個(gè)頁(yè)面包含這句話(huà)。一般來(lái)說(shuō),隨機(jī)挑選的一個(gè)句子,完整出現(xiàn)在另一篇無(wú)關(guān)文章中的可能性很低。

2、復(fù)制內(nèi)容的害處

很多SEO對(duì)復(fù)制內(nèi)容有個(gè)誤解,認(rèn)為網(wǎng)站上有復(fù)制內(nèi)容,搜索引擎就會(huì)懲罰。其實(shí)搜索引擎并不會(huì)因?yàn)榫W(wǎng)站有少量復(fù)制內(nèi)容而懲罰或降權(quán)。搜索引擎做的只是從多個(gè)頁(yè)面中盡量挑選出真正的原創(chuàng)版本給予應(yīng)有的排名,其他復(fù)制版本不在搜索結(jié)果中返回或排在比較靠后的位置。

不過(guò)既然交給搜索引擎去判斷,就有可能判斷失誤,把本來(lái)是原創(chuàng)的頁(yè)面當(dāng)做轉(zhuǎn)載或抄襲的復(fù)制內(nèi)容,因而排名不好。這對(duì)原創(chuàng)頁(yè)面來(lái)說(shuō)確實(shí)就像是懲罰,不過(guò)不是因?yàn)閺?fù)制內(nèi)容本身,而是因?yàn)樗阉饕媾袛嘣瓌?chuàng)失敗。

同站出現(xiàn)復(fù)制內(nèi)容看似沒(méi)有那么嚴(yán)重,不管搜索引擎判斷哪個(gè)版本是原創(chuàng),都是自己網(wǎng)站上的頁(yè)面。問(wèn)題是,搜索引擎認(rèn)為的最合適的URL與SEO站長(zhǎng)自己認(rèn)為的最合適的URL有可能不一樣,SEO站長(zhǎng)優(yōu)化和做鏈接時(shí)把精力放在頁(yè)面A,搜索引擎卻認(rèn)為頁(yè)面B最好(A與B內(nèi)容一樣),SEO站長(zhǎng)花在頁(yè)面A上的精力就浪費(fèi)了很多。

同一個(gè)網(wǎng)站內(nèi)的復(fù)制內(nèi)容會(huì)分散權(quán)重。既然頁(yè)面在網(wǎng)站上出現(xiàn),就必然有鏈接連向這些頁(yè)面。如果一篇獨(dú)特內(nèi)容只出現(xiàn)在一個(gè)網(wǎng)址,網(wǎng)站上的鏈接就能集中到這一個(gè)網(wǎng)址,使其排名能力提高。鏈接分散到多個(gè)網(wǎng)址,會(huì)使得每一個(gè)網(wǎng)址排名能力都不突出。外部鏈接也同樣,很可能分散到不同URL。

同站復(fù)制也造成收錄過(guò)多沒(méi)有意義的頁(yè)面,在域名權(quán)重不高的情況下,可能擠占了其他獨(dú)特內(nèi)容的收錄機(jī)會(huì)。如果網(wǎng)站上存在大量復(fù)制內(nèi)容,可能使搜索引擎對(duì)網(wǎng)站質(zhì)量產(chǎn)生懷疑,導(dǎo)致被懲罰。

3、消除復(fù)制內(nèi)容

網(wǎng)址規(guī)范化問(wèn)題造成的復(fù)制內(nèi)容,前面已經(jīng)討論過(guò)。最好的解決辦法是,確保一篇文章只對(duì)應(yīng)一個(gè)URL,不要出現(xiàn)多個(gè)版本,網(wǎng)站所有內(nèi)部鏈接統(tǒng)一連到這個(gè)URL。某些時(shí)候需要使用301重定向。

不是由于網(wǎng)址規(guī)范化造成的同站內(nèi)復(fù)制內(nèi)容,解決的最好方法是選取一個(gè)版本允許收錄,其他版本禁止搜索引擎抓取或收錄。

既可以使用robots文件禁止抓取,也可以使用noindex meta robots 標(biāo)簽禁止索引。連向不希望收錄的復(fù)制內(nèi)容的鏈接使用nofollow標(biāo)簽,JavaScript等阻止蜘蛛爬行。

另一個(gè)解決復(fù)制內(nèi)容的方法是使用 canonical 標(biāo)簽。canonical 標(biāo)簽既可以應(yīng)用在網(wǎng)址規(guī)范化引起的復(fù)制內(nèi)容上,也可以用在其他情況下。

比如網(wǎng)站上同一個(gè)款式的鞋子可能分為不同型號(hào),型號(hào)之間唯一的區(qū)別只是顏色。這些型號(hào)生成多個(gè)網(wǎng)址,產(chǎn)品說(shuō)明也幾乎完全一樣,只是說(shuō)明顏色的地方不一樣。

這時(shí)就可以使用canonical 標(biāo)簽,用戶(hù)不會(huì)被轉(zhuǎn)向,還是看到不同頁(yè)面,但搜索引擎會(huì)把權(quán)重集中到其中一個(gè)型號(hào)上,從而避免復(fù)制內(nèi)容。

帶有Session ID 的頁(yè)面也可以使用canonical 標(biāo)簽,比如頁(yè)面:http://www.yongfengseo.com/page-a.html 放上代碼:

這樣,后面無(wú)論生成什么 Session ID:

http://www.yongfengseo.com/page-a.html?sessionid=123456

http://www.yongfengseo.com/page-a.html?sessionid=456789

上面的URL都會(huì)被搜索引擎把權(quán)重集中到:http://www.yongfengseo.com/page-a.html

不同網(wǎng)站之間復(fù)制內(nèi)容解決起來(lái)就比較麻煩,因?yàn)槠渌W(wǎng)站上的內(nèi)容是無(wú)法控制的。能夠做的只有兩點(diǎn)。一是在頁(yè)面中加入版權(quán)聲明,要求轉(zhuǎn)載的網(wǎng)站保留版權(quán)聲明及指向原出處的鏈接。

有些聚合網(wǎng)站會(huì)抓取feed自動(dòng)生成內(nèi)容,所以在feed中也要加入版權(quán)聲明和鏈接。

一般來(lái)說(shuō),原創(chuàng)版本的外部鏈接會(huì)比轉(zhuǎn)載多一些,就算在中文互聯(lián)網(wǎng)這個(gè)對(duì)版權(quán)極不重視的環(huán)境下,也還會(huì)有一些站長(zhǎng)轉(zhuǎn)載時(shí)保留原出處鏈接。對(duì)搜索引擎來(lái)說(shuō),指向原出處的鏈接是判斷原創(chuàng)的最重要信號(hào)。

另一點(diǎn)就是堅(jiān)持原創(chuàng),假以時(shí)日必定能夠增加網(wǎng)站權(quán)重,使網(wǎng)站上內(nèi)容被判斷為原創(chuàng)的機(jī)會(huì)增加。如果有其他網(wǎng)站大量抄襲,造成原創(chuàng)內(nèi)容不能獲得排名,也可以考慮聯(lián)系對(duì)方,要求加上版權(quán)鏈接或刪除抄襲內(nèi)容,或者向?qū)Ψ街鳈C(jī)、域名提供商投訴,向搜索引擎投訴等。

本文來(lái)自微信公眾號(hào):平哥SEO優(yōu)化(qingpingseo)

申請(qǐng)創(chuàng)業(yè)報(bào)道,分享創(chuàng)業(yè)好點(diǎn)子。點(diǎn)擊此處,共同探討創(chuàng)業(yè)新機(jī)遇!

相關(guān)標(biāo)簽
seo優(yōu)化
seo優(yōu)化技術(shù)

相關(guān)文章

  • 個(gè)人做網(wǎng)站,一年可以賺多少錢(qián)?聊賣(mài)站

    今天,有一些圈外的朋友來(lái)咨詢(xún)我做網(wǎng)站變現(xiàn)的事情,問(wèn)我:賀老師,我要是做一個(gè)網(wǎng)站,一年可以賺多少錢(qián)?我用2張圖片,來(lái)解答這個(gè)問(wèn)題:做一個(gè)網(wǎng)站,一年可以賺多少錢(qián)?取決于如何做這個(gè)站點(diǎn),能把它帶到什么樣的地步!有人半年可以賺24個(gè)W,但是也有人,一年只賺2000塊:是什么問(wèn)題,導(dǎo)致了如此懸殊的一個(gè)差距呢?

  • 微信問(wèn)一問(wèn)是什么,有什么優(yōu)勢(shì)、怎么結(jié)合搜一搜SEO做排名引流?

    前言:這是白楊SEO原創(chuàng)第457篇。為什么想到寫(xiě)這個(gè)?因?yàn)閮蓚€(gè)月前微信剛上線(xiàn)內(nèi)測(cè)我就發(fā)了一個(gè)問(wèn)一問(wèn)視頻,現(xiàn)在基本算全開(kāi)放了,所以想讓做SEO,流量,甚至想玩普通人都知道這個(gè)新渠道,希望對(duì)大家做品宣和搞流量有幫助。文章大綱:1、微信問(wèn)一問(wèn)是什么?入口在哪?2、做微信問(wèn)一問(wèn)有什么好處?3、微信問(wèn)一問(wèn)怎么

    標(biāo)簽:
    seo優(yōu)化
  • 企業(yè)做SEO優(yōu)化的重要性和意義?網(wǎng)站為何要做優(yōu)化?

    很多大小型企業(yè)都有自己的網(wǎng)站,那么企業(yè)做網(wǎng)站是干嘛呢?有什么作用?我的理解是,您首先是希望為了能夠在百度、360、搜狗等搜索引擎中得到展現(xiàn),讓更多的用戶(hù)通過(guò)網(wǎng)上搜索看到公司企業(yè)正在做什么,企業(yè)形象背景以及口碑如何,最終目的是為了營(yíng)銷(xiāo),為了推廣我們的品牌,讓更多的需求客戶(hù)通過(guò)網(wǎng)絡(luò),通過(guò)百度、360等搜

  • 如何用人工智能創(chuàng)作結(jié)合SEO以知乎為例獲取百度搜索流量?

    使用大致流程如下:1、確定自己業(yè)務(wù)的主要關(guān)鍵詞2、確定想要的流量(百度搜索來(lái)的還是知乎站內(nèi))3、確定自己想用知乎文章為主還是問(wèn)答為主4、挖掘用戶(hù)需求的關(guān)鍵詞5、用ChatGPT或平替產(chǎn)品生成文字內(nèi)容6、生成的內(nèi)容優(yōu)化修改,用來(lái)寫(xiě)文章或者做回答7、布局SEO的用戶(hù)需求關(guān)鍵詞在標(biāo)題和內(nèi)容里8、置入引流信

    標(biāo)簽:
    seo優(yōu)化
  • 最接地氣的SEO指南 讓新入行的你少走一大段彎路

    老賀是2005年開(kāi)始做網(wǎng)站的,那時(shí)候我們國(guó)內(nèi)的網(wǎng)站并不多,但是每天分享知識(shí)的人卻不少,整天混跡在A5站長(zhǎng)網(wǎng)、站長(zhǎng)之家、落伍者上面,不斷的充實(shí)自己,不過(guò)信息良莠不齊,也走了很多的彎路。之后在實(shí)踐、實(shí)戰(zhàn)中有了技能,在2008年的時(shí)候,老賀開(kāi)始對(duì)外搞SEO,就這樣一晃十多年過(guò)去了。今天這篇文章,老賀只寫(xiě)一

熱門(mén)排行

信息推薦