會員書架
首頁 > 仙俠小說 > 重寫科技格局 > 第65頁

第65頁(第1/2 頁)

目錄
最新仙俠小說小說: 路人的修仙生存法則修羅獄主太虛彼岸穿越異世界:開啟冒險之路雲靄蒼穹靈脈?魔脈?不,我修天脈!鎮魂紀元腹黑公子之傳奇今生滄興大陸煉化潛龍大陸的小癟三十界天尊天元大陸之林羽小道參上修仙從抽獎開始開局撿個女宗主衍盡歸墟國度:巫蓮小生問道之九天逆世凡人修仙:從買到降雷符開始修仙大冒險之笑鬧仙途

但說的簡單一點,其實核心就是一個東西,演算法。

因為每一個技術都離不開演算法。

「我不太清楚在座各位在搜尋引擎方面的建樹和理解,我只能先按照我的節奏說下去,如果誰有問題可以隨時打斷我。」孟謙走到黑板前直入正題。

「在我展示我的核心技術之前,我們先來看看當下的三大主流演算法,白度的超鏈分析,谷歌的parank演算法以及ib的hits演算法。

幾乎所有人都覺得白度的超鏈分析是三個演算法中最落後的,但有些事情我們還是要多角度的看一看,白度的超鏈分析在某種程度上可以算得上是奠定了搜尋引擎的發展基礎。

有一些聲音說谷歌其實是剽竊了白度的超鏈演算法,畢竟李彥宏這個專利確實在谷歌之前,我們現在不去猜測真假,但這種說法體現了一個很重要的訊號,其實不管是哪一家的演算法,演算法基礎其實都是一樣的。

抓取網頁資訊,然後用某種機制對這些網頁進行排序,當使用者輸入關鍵詞進行搜尋時,根據關鍵詞匹配出按照機制進行排列的網頁。

那麼白度輸在哪呢?關鍵就在於白度現在過於簡單的基於在某次搜尋的所有結果中被其他網頁用超連結指向的越多的網頁就價值越高這種基礎排序方式。

相比之下,谷歌的parank就多了兩件很重要的事情,第一件事情是,把a頁面到b頁面的連結解釋為a給b的投票行為,谷歌在這裡會同時考評a和b的等級從而形成新的等級。

也就是每一個頁面都有pr值,同時你的pr值會成為其他頁面pr值的參考。

然後不斷的重複計算每個頁面的pr。假設給每個頁面一個隨機pr值,那麼經過不斷的重複計算,這些頁面的pr值會趨向於穩定,也就是收斂的狀態。

至於hits,其理論基礎依然沒變,它最大的特點或者說改變就在它意識到parank演算法平均的分佈權值不符合連結的實際情況。

所以hits演算法中引入了另外一種網頁,稱為hub網頁,hub網頁是提供指向權威網頁連結集合的web網頁。

所以使用hits的搜尋結果會比其他兩者都更權威,但這個演算法會大大增加計算負擔,對吧?」

孟謙看了一眼ib出來的哥們,對方愣了一下有點好像不確定的點了點頭。

所以現在簡單總結一下,搜尋引擎的演算法基礎就是超鏈分析,演算法的優劣勢就在於如何讓搜尋結果更具有參考價值,讓使用者獲得更有效的資訊。

當然如果能直接理解使用者的需求然後幫他搜尋他最想要的內容,這是最理想的搜尋引擎狀態,但誰都知道這是不可能的。

因此搜尋引擎的好壞決定的就是同樣的關鍵詞下,你是否能讓相對更多的人獲得他們想要的內容。

10個使用者用谷歌,5個人找到了自己想要的東西,如果用我們的搜尋引擎,6個人找到了自己想要的東西,在這裡領域目前的技術環境下,我們就是更優秀的。

那麼在這個理解基礎上,我接下來要給大家介紹的,就是我的搜尋引擎演算法,動態規則超鏈分析演算法。

動態規則超鏈分析演算法有以下幾個變化。

第一,剛才我們提到了,好的搜尋引擎是要看在同一關鍵詞下誰的反饋結果更能滿足使用者需求,那麼當使用者在搜尋某個東西的時候,從大機率來說,他想要看到的結果應該是與這個東西具有更垂直型相關的內容。

舉個例子,客戶在搜尋汽車的時候,不管他是想買車,還是想了解汽車知識,汽車類的專業網頁對他的幫助應該都是更大的。

所以在我的演算法中,對於指向某一個網站的連結,我首先會做垂直率評分,比如有現在有10個網站連

目錄
清冷美人變成小奶貓後三國從忽悠賈詡開始錦瑟穿越成渣女妖王獨寵:邪魅醫妃惹不起精彩修仙傳
返回頂部