網(wǎng)站推廣是網(wǎng)站運營中非常重要的一部分,而對網(wǎng)站進行搜索引擎優(yōu)化是網(wǎng)站推廣中相對比較廉價的一種方式,同時也是最常見的一種方式,絕大多數(shù)網(wǎng)站都注重這個方面。因為百度是全球最大的中文搜索引擎,也是占據(jù)國內絕大多數(shù)份額的產品,所以很多網(wǎng)站注重的也幾乎就是百度,可以說百度的一舉一動都影響著無數(shù)網(wǎng)站的命運,因此也有數(shù)以萬計的人去分析研究百度的規(guī)律。
眾所周知,百度近一年來好像沒有消停過,我們可以認為是應對黑馬選手奇虎挑戰(zhàn)而進行的,但是不管怎么樣,這些動作已經做出來了。比如針對外鏈作弊的綠蘿算法,這個算法后來還有了升級版本;針對垃圾頁面的石榴算法以及鼓勵原創(chuàng)知識的原創(chuàng)星火計劃。同時也上線了很多站長使用的工具,比如頁面測評、索引量查詢、拒絕外鏈等等。
然而就在今天我自己上網(wǎng)的時候發(fā)現(xiàn)了一個現(xiàn)象,而這個現(xiàn)象就是跟百度的原創(chuàng)計劃相關的,我想有必要跟大家分享一下,一者可以讓還不知道這個信息的朋友知道,二者讓更多的人去分析思考可能就會得出更加客觀的答案。
今天在搜索熱點新聞的時候,其中一個結果吸引了我,我看到這個結果是指向到中國新聞網(wǎng)的,大家都知道這個網(wǎng)站是國家級的權威新聞網(wǎng)站,其中的很多稿件都是原創(chuàng)的,所以這樣的網(wǎng)站收錄結果中出現(xiàn)百度的原創(chuàng)標示也不足為奇。然而大家都清楚現(xiàn)在的百度原創(chuàng)標示中有作者、來源、發(fā)表時間等,就是其中作者結果引起了我的注意,我發(fā)現(xiàn)在百度搜索結果中的作者名稱是漢字的全拼,而在最終內頁中卻是寫著責任編輯然后加上一個編輯的名字,有的甚至連責任編輯都沒有寫上去,也就是說整個頁面都沒有出現(xiàn)作者的信息,但百度搜索結果當中卻出現(xiàn)了作者信息,而且還是名字的全拼字母。
我開始還以為是百度自己知道把抓取到的內頁信息去分析,然后把漢字轉換為對應的拼音,但有的頁面我們搜索整個頁面的文字都沒有看到漢字姓名,也沒有看到拼音姓名。然后我就想到了是不是這些信息是不給普通用戶看,而是基于某個規(guī)則給百度看呢。于是我就看了一下中國新聞某個頁面的前端源代碼。我查找一下,發(fā)現(xiàn)其中果然包含了漢字拼音,而且還有作者中文姓名,然后還有文章的地址、所屬類目、在論壇的相關討論數(shù)量、發(fā)表時間、標題、文章ID號等等。
而且我同時也發(fā)現(xiàn)所有的input中的tpye的屬性值都是hidden,而這個只要大家稍微熟悉一點網(wǎng)頁編程就知道是隱藏的意思,也就解釋了難怪我們在頁面查找不到拼音。然而在源代碼的注釋中寫著“表情字段開始”著實讓人摸不著頭腦。為了探個究竟我也發(fā)現(xiàn)了其他的網(wǎng)站也有類似的現(xiàn)象,我看了一下鳳凰網(wǎng)的某個頁面的前端源代碼跟百度收錄這個頁面為原創(chuàng)結果后,也有了類似的結果,只是這里用的是display:none;而已。
相比上述兩個比較權威網(wǎng)站的源代碼,我們可以知道雖然兩者在標記作者信息采用的參數(shù)命名等方面有不同,但也有很多相通的地方,那就是都在頁面代碼中標記出作者的信息,而且相關的參數(shù)名稱都與作者或者編輯的意思相關,同時這些信息也是在用戶面前隱藏起來的。
大家已經知道的是,要在百度搜索結果中出現(xiàn)原創(chuàng)標示,首先網(wǎng)站是一些權威的大網(wǎng)站,我們草根做的小網(wǎng)站是不可能被標示的,無論我們的內容有多么好都不可能被標示,被標示的只會是轉載這樣內容的大網(wǎng)站。當然我們也知道另外也需要我們是這樣內容的原創(chuàng)作者或者比較先轉載小網(wǎng)站的。
但通過上面中國新聞網(wǎng)和鳳凰網(wǎng),我又有了新的發(fā)現(xiàn),或者說發(fā)現(xiàn)了兩種可能,那就是那些大網(wǎng)站內頁源代碼中出現(xiàn)的那些標記作者信息的代碼。可能是百度跟他們有合作,也就是內容共享,告訴他們在設計頁面的時候留下這樣一個標;也有可能是他們自己知道只要自己的網(wǎng)站符合百度進行標示的要求,然后這些標記會增加被標記的幾率;我想幾乎不可能是百度單方面加上去的,因為網(wǎng)站可不是百度隨便能改的。
說到這里,我覺得要跟大家談一談我眼中的這個百度原創(chuàng)計劃了,雖然是一個很老的話題了,但我覺得在這里還是要結合我新的發(fā)現(xiàn)來說一說。就說這個實例中出現(xiàn)的那些東西吧,我們就當做出現(xiàn)那些標記再加上原創(chuàng)的內容就能被標示為原創(chuàng),那也沒有多少人知道這種標記的規(guī)則,我想如果真是這樣的話百度一個號稱為了互聯(lián)網(wǎng)良性發(fā)展的公司應該會在其站長平臺說明這些問題。很顯然,根本的問題不是這個標記,要不然我也可能馬上實現(xiàn)自己的搜索結果中出現(xiàn)百度原創(chuàng)標示。所以說,對于草根站長百度原創(chuàng)確實不像其自稱的那樣美好,因為在現(xiàn)實當中互聯(lián)網(wǎng)的大多數(shù)內容都是由中小型網(wǎng)站創(chuàng)造的,那些被標記為原創(chuàng)內容的大網(wǎng)站中的大多數(shù)內容都是轉載的,我想這樣不會因為有了原創(chuàng)計劃來激發(fā)大家的創(chuàng)造內容的激情,反而可能起到相反的效果。
我們不能因為這樣殘酷的現(xiàn)實而去放棄,而是積極去面對這些挑戰(zhàn)。只有腳踏實地地去做,只要當我們有了一定的規(guī)模后,百度等那些巨頭認為跟我們合作有一定必要的時候,我們也可以寫一封郵件申請內容合作了!
本文來源:(由玫瑰情人網(wǎng)原創(chuàng),轉載請注明出處!)
申請創(chuàng)業(yè)報道,分享創(chuàng)業(yè)好點子。點擊此處,共同探討創(chuàng)業(yè)新機遇!