谷歌為了慶祝自己的十五歲生日,偷偷的上線了蜂鳥算法。對于官方的描述,貌似只有這么兩個印象深刻的點:“顛覆”、“影響90%的查詢詞”。
至于這個蜂鳥到底是個神馬玩意兒,目前從盧松松處了解到它的展現(xiàn)形式類似于百度的框計算。嗯,還有Zac大神的說法:這是一個影響排名的算法,蜂鳥能夠更智能的理解搜索詞背后的意義。
了解搜索引擎工作原理的都知道,搜索引擎分抓取->索引->排名三大步。在排名階段,搜索引擎會將用戶搜索的詞或者句子進行分詞處理,按照拆完的詞去索引庫(倒排索引)里找對應(yīng)的頁面,然后根據(jù)一些列牛A和牛C之間徘徊的算法,將搜索結(jié)果呈現(xiàn)在用戶的面前。
而蜂鳥算法之所以可以具備顛覆這個字眼,實在是因為它不只是簡單的對用戶搜索的詞或者句子進行拆分,而是會根據(jù)語意的智能分析了解到用戶真實的搜索意圖,從而去索引庫中召回想要的結(jié)果。
來看看Zac舉的一個例子:
傳統(tǒng)搜索排名算法通過詞的匹配,比如“iPhone 5s”、“買”,在包含這些詞的頁面中找到相關(guān)頁面。蜂鳥能更好理解查詢詞背后的實際意義,比如理解你家的位置(比如你用了Google地圖之類的服務(wù),或者僅僅是用Google搜索,Google也能知道你的位置),比如理解“地方”更多指的是個實體店(如果搜索的是“附近什么地方菜好吃”,這里的“地方”指的是飯館),比如能理解iPhone 5s是個特定電器設(shè)備。
例子結(jié)束,來扯扯我的看法:
智能語意分析,得益于谷歌自身的產(chǎn)品(地圖)、用戶的搜索習慣(谷歌之前在搜索結(jié)果上就有展示)、集成社交媒體上透漏出來的數(shù)據(jù)(自己猜的)、還有那個牛叉的學科——統(tǒng)計學(不用猜肯定有的)。
至于出現(xiàn)這個算法的目的,相信大家都看到了官方給出的解釋:
蜂鳥算法能夠以更加人性化的方式與用戶互動,并提供更為直接的答案。這樣的算法改進是必需的,因為隨著網(wǎng)絡(luò)搜索日漸普及,許多網(wǎng)民會在搜索框中輸入完整的問句進行搜索。蜂鳥算法可以借助更加復雜的搜索請求更好地理解文字的概念,而不僅僅是文字本身,而且還能在各種概念之間建立聯(lián)系。
說實話,總感覺這個說法太官方,搔不到我的癢處。
因為個人認為它其實更多是在為移動搜索布局,好吧,來扯扯支撐我觀點的論據(jù):
走在路上,更多會看到學生人群在用微信語聊,而不是向我們那個年代發(fā)著短信,或者掛著手機QQ打字聊天,語音處理技術(shù)的發(fā)展,正在改變著人們的溝通、交流、獲取信息的習慣,自然,搜索的市場在未來也會更加趨向語音化。一旦語音化之后,很自然的一個問題就是搜索詞的句子化(問答的句子,尋找結(jié)果)。
移動端本身就不具備PC端大大的顯示屏幕,人們不可能也沒有足夠的耐心去苦逼的一個個點開搜索結(jié)果查看(類似百度框計算的展示,在搜索引擎結(jié)果頁直接展示結(jié)果)。
移動端的搜索會緊密契合自身所處的位置以及當時面臨的狀況等問題(蜂鳥可以很好的結(jié)合搜索引擎的地圖,手機自身的定位也不無可能)。
用戶對搜索結(jié)果的要求會更加精準(加上位置,加上搜索習慣,加上統(tǒng)計學,加上各種數(shù)據(jù),可以很好的理解問題的意思,從而展現(xiàn)出精準的結(jié)果)。 好吧。上述是個人的三點不成熟見解。當然,除此之外,個人認為,搜索引擎返回結(jié)果對于描述的展示也是一個十分需要努力的方向(結(jié)構(gòu)化數(shù)據(jù)的展現(xiàn)),比如當我搜了莘莊附近的湘菜館時,我更希望在描述里能夠看到它的招牌菜,大家對他的整體評價等信息。
嗯,打完收工,歡迎大家噴口水,抒己見。
最后祝大家國慶節(jié)快樂!
轉(zhuǎn)載請注明鏈接地址。
申請創(chuàng)業(yè)報道,分享創(chuàng)業(yè)好點子。點擊此處,共同探討創(chuàng)業(yè)新機遇!