第066章【能顛覆的不止是搜尋引擎】(第1/2 頁)
會議大廳,羅靖環視眾人道:“比如一個問題是對一個小孩解釋什麼是登入火星,給的回答是一些人去了火星。然後把這些對話內容作為一個資料集,讓靈境gpt進行學習,但光是上課不能畢業,想要畢業就得做題、考試。”
羅靖環視眾人笑道:“其實就是一個反饋機制,所以我們接下來的任務是要給靈境gpt加上來自人類反饋的強化學習,也就相當於是參加考試。回答錯誤,重修;回答正確,進一步學習,直到靈境gpt透過考試拿到足夠的學分來證明自己的能力。”
回頭瞄了眼會議大螢幕並且按了下小遙控器,羅靖條理清晰地說:“具體怎麼做呢?還是剛剛的問題舉例,給一個小孩解釋什麼叫登陸火星,讓微調過的也就是上完課程的靈境gpt來回答,會生成四個答案,a解釋重力、b解釋戰爭、c解釋火星是一個天體、d人類去了火星。”
說到這裡,羅靖頓了片刻繼續說道:“然後就是根據真實、無害、有幫助等若干維度來給這些答案排序、評分,排序結構就是d>c>b=a,之後就是將這些問題和答案以及答案的排序,將這些資料集拿來訓練一個獎勵模型,訓練的目標是讓建立模型的評分標準接近人工排序標準。”
“相當於是訓練一個ai老師,之後就是最後一步了,透過強化學習來繼續訓練微調後的靈境gpt,把生成的答案拿去給前面訓練好的獎勵模型進行打分,根據打分來調整,最終就是靈境gpt生成的答案獲得的分數越高越好,一個語言大模型就誕生了。”
羅靖環視在場的工程師們:“隨著持續的學習、不斷的資料投餵,用海量的資料對靈境gpt進行訓練,直到突破某個臨界值節點的那一刻,它將表現的越來越像人,以至於一個普通人隔著螢幕跟它聊天的時候甚至都無法察覺對方是個ai。”
接下來,羅靖繼續講述這個語言模型的核心,在場的工程師們直呼開眼,這要是成功了簡直不得了。
這就是t10級大神麼?
末了,羅靖突然話鋒一轉,旋即說道:“但靈境gpt的大模型以此開發,還是有它自身的侷限性,而且這種侷限性是先天註定的。”
與會的工程師們一言不發,一個個都認真的聽著,大部分人還在做筆要紀錄。
羅靖說道:“要讓靈境gpt能夠‘讀懂’人類的語言是基於統計學規律靠死記硬背,那就意味著它沒有接觸過的知識是不知道的,比方說投餵給靈境gpt的歷史資料知識是截止到2010年,那麼在2010年之後到現在發生的事情它就一概不知,無法生成正確答案。”
眾人不由得點了點頭。
羅靖接著說道:“這種死記硬背就顯得靈境gpt很不靈動,也意味著靈境gpt只有知識而沒有常識。再舉個例子,比如靈境gpt一本正經的告訴你關羽跟宋江是結拜兄弟,這種人工智障的情況就避免不了。”
在場的人們不禁鬨堂一笑。
羅靖接著說道:“要避免這個問題不是沒有解決方案,便是從知識圖譜著手。以符號的方式,結構化的描述物理世界中的概念及其相互關係,比如‘人有腳’,其中‘人’是主體,‘有’是關係,‘腳’是受體,透過這種方式讓靈境gpt擁有常識推理能力。”
“有了知識圖譜後,比方說靈境gpt擁有了《三國演義》和《水滸傳》裡的人物關係圖譜,推導之後就能得出關羽和宋江根本就不是結拜兄弟,兩者半毛錢關係都沒有。”
值得一提的是,知識圖譜的研究歷史最早可以追溯道上個世紀六十年代,從第一代人工智慧符號ai的時候已經開始有人做了,當時對於知識圖譜的定義就是“符號ai的邏輯表示”,但構建一個通用型的知識圖譜實在太難太難了。