筆者之前發(fā)表了一篇《巧用301重定向?qū)?04錯(cuò)誤轉(zhuǎn)化為網(wǎng)站外鏈》的文章,談了一下如何通過(guò)301重定向的方式,將從外部得到錯(cuò)誤URL轉(zhuǎn)化為可訪問(wèn)的URL,從而達(dá)到傳遞權(quán)重的文章。
今天在站長(zhǎng)網(wǎng)看到了一篇《淺談利用301重定向?qū)?04頁(yè)面轉(zhuǎn)移成自己外鏈的危害》,反駁了我之前那篇文章中的觀點(diǎn)。我覺(jué)得非常好,SEO行業(yè)正應(yīng)該有這種質(zhì)疑的精神和獨(dú)立思考的能力。
仔細(xì)拜讀了文章,發(fā)現(xiàn)作者誤解了我的意思。所以再寫一篇文章澄清一下其中的觀點(diǎn),以及介紹一下301重定向的作用。
1.首先我明確兩個(gè)在《使用301重定向?qū)?04錯(cuò)誤轉(zhuǎn)化為網(wǎng)站外鏈》一文中的思路:
2.文章所講述的是將404錯(cuò)誤URL,通過(guò)301重定向回到原文的URL。這點(diǎn)需要說(shuō)明,我沒(méi)有在文章提到任何301到首頁(yè)或者其他頁(yè)面的意思 文章中的例子,講述的是從外部(B網(wǎng)站)鏈入自身網(wǎng)站(A網(wǎng)站),在過(guò)程中有可能出現(xiàn)的URL錯(cuò)誤拼寫、鏈接添加錯(cuò)誤甚至故意產(chǎn)生錯(cuò)誤URL的行為。而不是A網(wǎng)站自身出現(xiàn)的404錯(cuò)誤
原文一直在那里,有質(zhì)疑的朋友可以再仔細(xì)閱讀一下。以下我再反駁一下這位朋友的觀點(diǎn)(藍(lán)字是有反駁意見(jiàn)朋友的觀點(diǎn)):
反駁第一段
“原作者,將外鏈指向中的404錯(cuò)誤歸結(jié)于是網(wǎng)站外部造成的,這句話無(wú)可厚非,但是這種404錯(cuò)誤的出現(xiàn),也是由于自己網(wǎng)站程序所決定的,既然出現(xiàn)了就沒(méi)有辦法逃避,就比如在站長(zhǎng)網(wǎng)上頁(yè)面也可以出現(xiàn)很多個(gè)這樣活著那樣的后綴404頁(yè)面,直接在后面加入1.html,2.html,就可以了,如此而已,但是如果有人處心積慮的用外鏈的形式來(lái)進(jìn)行鏈接這樣的網(wǎng)頁(yè),那也是為網(wǎng)站帶來(lái)鏈接,如此而已,頂多產(chǎn)生一個(gè)404頁(yè)面,而不會(huì)有其他。”
網(wǎng)站出現(xiàn)404錯(cuò)誤,不一定是網(wǎng)站內(nèi)部程序的問(wèn)題。蜘蛛通過(guò)外部網(wǎng)站(以B網(wǎng)站為例)一個(gè)錯(cuò)誤的URL爬行到自身網(wǎng)站(以A網(wǎng)站為例),同樣會(huì)造成404錯(cuò)誤,即:錯(cuò)誤的URL導(dǎo)致了錯(cuò)誤的頁(yè)面。
蜘蛛是不會(huì)管你鏈接URL存在于網(wǎng)站內(nèi)部還是外部,只要在順著URL爬行的過(guò)程中出現(xiàn)了“頁(yè)面不存在”的情況,就會(huì)記錄一個(gè)404錯(cuò)誤。
這點(diǎn)我們?cè)诠雀韫芾韱T工具的“運(yùn)行狀況” — “抓取錯(cuò)誤” – “找不到” 一欄中可以明確的看到。404錯(cuò)誤被谷歌分為“在sitemap中” (內(nèi)因)和 “鏈接到您網(wǎng)站網(wǎng)頁(yè)的域” (外因)兩項(xiàng)。
顧名思義,其中“鏈接到您網(wǎng)站網(wǎng)頁(yè)的域”是指從B網(wǎng)站鏈接到A網(wǎng)站的URL。
反駁第二段
“而原作者的意思是如何把握這一方面的權(quán)重,想要將這種外鏈的權(quán)重直接倒回去,而不是放掉,這里呢,筆者也有自己的觀點(diǎn),本身這種外鏈“;,這種外鏈所鏈接過(guò)來(lái)的就是404頁(yè)面,如果你將這些頁(yè)面301掉,這種情況就和網(wǎng)站中出現(xiàn)大量的404頁(yè)面,然后直接將404頁(yè)面301到一個(gè)頁(yè)面的情況是一樣的;那么如果你的網(wǎng)站有404頁(yè)面,那么為了防止這些權(quán)重的流失,難道將這些頁(yè)面全部301到首頁(yè)?這完全就是不符合搜索引擎的要求,如果想知道清楚的話,就直接百度一下“404頁(yè)面301到首頁(yè)的危害就”就可以明白更多。”
首先,對(duì)于“自身行為”還是“外部行為”,顯然搜索引擎有著明確的區(qū)分。拿鏈接建設(shè)來(lái)說(shuō),內(nèi)鏈和外鏈在權(quán)重方面的效果是不同的。這點(diǎn)大家都很清楚。其核心思想就是外鏈?zhǔn)蔷W(wǎng)站站長(zhǎng)無(wú)法控制的,而內(nèi)鏈?zhǔn)钦鹃L(zhǎng)可以自行設(shè)置的。雖然在搜索引擎的發(fā)展過(guò)程中,出現(xiàn)“可被站長(zhǎng)控制的外鏈”這一因素(就是平常的外鏈建設(shè))。但無(wú)論可控還是不可控,有一個(gè)思想是明確的,即誰(shuí)也不會(huì)在別人的網(wǎng)站可以發(fā)布正確URL的前提下,卻去發(fā)錯(cuò)誤的URL,導(dǎo)致用戶無(wú)法正常訪問(wèn)自己的網(wǎng)站或在自己的網(wǎng)站上出現(xiàn)“該網(wǎng)頁(yè)不存在”的字眼。
其次,對(duì)于301到原網(wǎng)頁(yè)還是301到首頁(yè)。這點(diǎn)我不想多說(shuō),大家都原文就可以明白我的意思。我這里想說(shuō)的是搜索引擎如何甄別原文的出處的一些信號(hào):
1.搜索引擎最先在哪里看到內(nèi)容
2.諸多同樣內(nèi)容所在的域名信任度
3.指向哪里的鏈接最多(原文中的內(nèi)鏈)
4.拷貝是否鏈接回原始出處(版權(quán)鏈接)
由于第二條信號(hào)的存在,我們?cè)瓌?chuàng)作者很多發(fā)布或被轉(zhuǎn)載在其他網(wǎng)站的內(nèi)容,無(wú)法獲得好的排名。很多作者也對(duì)此有抱怨。但我們可以利用1、3、4點(diǎn)信號(hào)將這個(gè)錯(cuò)誤糾正過(guò)來(lái)。
百度在這方面做的還不是很好,但谷歌已經(jīng)可以很快且很準(zhǔn)的識(shí)別出原文的出處。這就得益于以上3條。而其中“拷貝是否鏈接回原始出處”這一因素,也是我在《使用301重定向?qū)?04錯(cuò)誤轉(zhuǎn)化為網(wǎng)站外鏈》這篇文章中所闡述的目的之一,還有一個(gè)目的大家也看到了就是傳遞權(quán)重。
最后,將一個(gè)用戶無(wú)法訪問(wèn)的錯(cuò)誤URL,合理的通過(guò)301的方式重定向到正確的URL。也對(duì)用戶體驗(yàn)有所幫助。我們同樣在谷歌管理員工具的“抓取錯(cuò)誤”中看到了這句話。
Googlebot 無(wú)法抓取該網(wǎng)址,因?yàn)樗赶虻木W(wǎng)頁(yè)不存在。通常,404 不會(huì)影響您的網(wǎng)站在搜索結(jié)果中的排名,但您可以借助它改善用戶體驗(yàn)。
解決404錯(cuò)誤的方式無(wú)非是通過(guò)robots.txt屏蔽,或者通過(guò)301重定向。我不認(rèn)為屏蔽后可以改善用戶體驗(yàn)。robots.txt的方式只能改善蜘蛛體驗(yàn)。因?yàn)橛脩酎c(diǎn)擊錯(cuò)誤URL后,訪問(wèn)的還是一個(gè)不存在的頁(yè)面和看到404錯(cuò)誤。
反駁第三段
“直接復(fù)制原話“如果針對(duì)不存在的網(wǎng)頁(yè)返回 404 或 410 以外的代碼(或?qū)⒂脩糁囟ㄏ蛑潦醉?yè)等其他網(wǎng)頁(yè),而不是返回 404),則可能會(huì)出現(xiàn)問(wèn)題。首先,這樣就等于告訴搜索引擎通過(guò)該網(wǎng)址可以找到實(shí)際的網(wǎng)頁(yè)。結(jié)果,搜索引擎可能會(huì)抓取該網(wǎng)址,并將其內(nèi)容編入索引。因?yàn)?Googlebot 要使用很多的時(shí)間處理不存在的網(wǎng)頁(yè),可能無(wú)法迅速找到您的網(wǎng)址或頻繁訪問(wèn)這些網(wǎng)址,也無(wú)法頻繁地訪問(wèn)這些網(wǎng)址,從而影響對(duì)您網(wǎng)站內(nèi)容的抓取量(另外,您一定也不希望自己的網(wǎng)站經(jīng)常出現(xiàn)在 [未找到文件] 的搜索查詢中)。”這是404頁(yè)面的原話,如果你不按照要求繼續(xù)錯(cuò)誤頁(yè)面的跳轉(zhuǎn)的話,可能出現(xiàn)的情況就是你的網(wǎng)站上出現(xiàn)大量的相同頁(yè)面,相同標(biāo)題,相同描述,相同內(nèi)容,等等,然后這就是不同的URL和相同的內(nèi)容之間的故事,至于以后會(huì)發(fā)生什么?這個(gè)大家可以自己去百度,自己去google上找找就知道了。”
反駁的朋友既然提到了google管理員指南,就千萬(wàn)別忘記摘錄另外一段文字:
一般來(lái)說(shuō),404 錯(cuò)誤不會(huì)影響您的網(wǎng)站在 Google 中的排名,因此您可以放心忽略這些錯(cuò)誤。這些錯(cuò)誤通常是由于以下原因?qū)е碌模浩磳懹姓`、配置有誤(例如由內(nèi)容管理系統(tǒng)自動(dòng)生成的鏈接)或 Google 加強(qiáng)了識(shí)別和抓取 JavaScript 等嵌入式內(nèi)容中的鏈接的力度。
要查看無(wú)效鏈接的來(lái)源,請(qǐng)點(diǎn)擊相關(guān)網(wǎng)址。在錯(cuò)誤對(duì)話框中,點(diǎn)擊鏈接自以下網(wǎng)頁(yè)標(biāo)簽。如果相關(guān)鏈接來(lái)自您的網(wǎng)站,請(qǐng)修復(fù)或刪除這些鏈接。如果這些鏈接來(lái)自外部網(wǎng)站,您可以使用這些數(shù)據(jù)改善網(wǎng)站的用戶體驗(yàn)。例如,如果某人本打算鏈接到您的網(wǎng)站但卻輸錯(cuò)了網(wǎng)址,那么就會(huì)出現(xiàn)拼寫有誤的合法網(wǎng)址(如 www.example.com/awesome 拼寫成了 www.example.com/awsome)。您可以將拼寫有誤的網(wǎng)址 301 重定向到正確的網(wǎng)址并通過(guò)該鏈接獲取預(yù)期流量,而不是返回 404 錯(cuò)誤。您也可以在將用戶定向到 404 網(wǎng)頁(yè)后,確保幫助他們找到所需內(nèi)容,而不是僅僅顯示“404 未找到”。不過(guò),我們只建議您在錯(cuò)誤鏈接可產(chǎn)生較高流量的情況下采取上述措施。
很遺憾的是,這位朋友只看到了其一,卻沒(méi)有看到其二。我們?cè)谧鯯EO時(shí),官方的資料非常重要,很多細(xì)節(jié)都隱藏在其中,需要花大量的時(shí)間去仔細(xì)閱讀和理解。
實(shí)際上,谷歌管理員工具中很多設(shè)置和說(shuō)明文字都是有其道理的。只是我們一些SEO不愿意去理解。就像404產(chǎn)生的內(nèi)因和外因這種事情,在“抓取錯(cuò)誤”一項(xiàng)中將它區(qū)分開(kāi)也是有其道理的。而不是閑著沒(méi)事干就那么做了。
總結(jié):
作為SEO,我們要吸取很多知識(shí),同時(shí)開(kāi)拓自己的思路和分析問(wèn)題的辦法。但需要確保你學(xué)習(xí)的知識(shí)是先進(jìn)的而不是陳舊的。否則自己的思路很容易被誤導(dǎo),從而產(chǎn)生不好的效果。
對(duì)觀點(diǎn)的爭(zhēng)論也是SEO工作中非常重要的一個(gè)環(huán)節(jié)。沒(méi)有人可以肯定的說(shuō)自己的理解是正確的,我們只能拿官方透露出來(lái)的一些資料和自己通過(guò)數(shù)據(jù)分析得出來(lái)的結(jié)論來(lái)證明自己思路和理論的正確性。
申請(qǐng)創(chuàng)業(yè)報(bào)道,分享創(chuàng)業(yè)好點(diǎn)子。點(diǎn)擊此處,共同探討創(chuàng)業(yè)新機(jī)遇!