看了很多文章,都是關(guān)于服務(wù)器日志的,似乎沒有定論。經(jīng)過我對服務(wù)器日志的分析和了解,做一下結(jié)論:
1、服務(wù)器返回200 0 0 ,代表著baiduspider對服務(wù)器進行了請求,得到了回應(yīng),抓取了新的數(shù)據(jù)。此種情況下,搜索引擎的處理流程是,如果是新發(fā)布的文章內(nèi)容,百度抓取并放出的可能性大于70%。如果是很早之前發(fā)布的文章,一般不會抓取以后馬上就釋放,一般到大更新,或者是進行數(shù)據(jù)對比,確定不是垃圾內(nèi)容以后,再進行釋放。
2、服務(wù)器返回200 0 64 ,很多人認(rèn)為這是被百度K掉的前兆。也有不少SEOer站出來解釋,這種情況未必是K站,一般有三種解釋。
目前,對于 200 0 64 的觀點大致分為以下幾種:
會話故障,請求不可到達,并非百度封站征兆
百度封站、“撥毛”或放入沙盒
64位操作系統(tǒng)
樂思蜀參考了大量相關(guān)文章,雖未得出最終結(jié)論,但覺得第一種觀點最合理,現(xiàn)分析如下。
首先來看 200 0 64 狀態(tài)碼的構(gòu)成
200 0 64:sc-status(協(xié)議狀態(tài)) sc-substatus(協(xié)議子狀態(tài)) sc-win32-status(Win32狀態(tài)碼)
sc-status(協(xié)議狀態(tài)):200 連接成功
sc-win32-status(Win32狀態(tài)碼):64 指定的網(wǎng)絡(luò)名不再可用
以上內(nèi)容摘自樂思蜀博客空間
以上三種解釋都有合理之處,不過經(jīng)過我對服務(wù)器日志的分析,研究如下:
出現(xiàn)200 0 64代碼,一般情況下,代表著baiduspider曾經(jīng)在此路徑下抓取過內(nèi)容。通過對比,搜索引擎認(rèn)為該網(wǎng)頁沒有必要再重新進行抓取。這路徑下的頁面,有可能之前已經(jīng)抓取過,但是未釋放,也有可能是抓取過,已經(jīng)釋放。
通常情況下,我們可以通過服務(wù)器日志的分析,列出200 0 64的頁面,對此類頁面,進行簡單的改動或者是處理,這樣的話,應(yīng)該可以引起搜索引擎的觸發(fā),重新對頁面進行收錄,可能會當(dāng)時釋放。
已經(jīng)被收錄的頁面產(chǎn)生64代碼,應(yīng)該是百度記錄此頁面被用戶頻繁訪問或者是通過搜索引擎得到搜索結(jié)果后點擊網(wǎng)站,造成baiduspider跟蹤用戶行為,對頁面進行重新訪問。
所以,我們可以針對服務(wù)器日志,開發(fā)一個適合seo的服務(wù)器日志分析工具,通過此工具,可以真實記錄蜘蛛或機器人的訪問,并對訪問返回的結(jié)果進行分析??梢酝ㄟ^分析,得到如何讓更多的頁面讓蜘蛛抓取并獲得良好排名的方案。
另外通過日志分析工具,從引申的角度講,可以制作一個蜘蛛誘餌,主動引導(dǎo)baiduspider進行爬行和抓取,并獲得良好的排名。我說的可不只是網(wǎng)站地圖。
原文連接:
申請創(chuàng)業(yè)報道,分享創(chuàng)業(yè)好點子。點擊此處,共同探討創(chuàng)業(yè)新機遇!