會員書架
首頁 > 都市言情 > 絕對掌控漫畫 > 第十二章 把自己當驢使喚

第十二章 把自己當驢使喚(第1/2 頁)

目錄
最新都市言情小說: 遲來的溫暖母愛成為仙帝后,回到地球只想擺爛!櫻花樹下的約定了重生77被離婚後,女大學生瘋狂求複合剛想藝考你說我跑了半輩子龍套?分手後女總裁非要嫁給我穿成反派只想苟,不料女主成為我舔狗巍然712黑脈多問幾個為什麼高武:升級從殺蚊子開始修仙之後,三拳打爆你的異能夢亂世魅魔詩行日記跨江大橋坍塌之謎睜眼1988一間破土房倆沒娘娃東邪物語職場之記我用AI製造神藥重生之都市修仙:仙界篇

當然股神10僅僅有分析模組和收集模組是不夠的,它還需要有一個資料處理模組,如果說分析模組是大腦,收集模組是手腳的話,那麼處理模組就是消化系統。

當海量的資料資訊被從資料海洋中抽取出來,需要對這些資訊進行加工處理,將它們處理成資料分析模組能夠利用的資料模式。

比如某個上市公司一個年度財報,裡面的內容非常之多,從人事變更到企業戰略,併購行為,利潤營收等方面都會涉及到,而這些東西又是關鍵性資訊。一個數萬字外加各種圖示的財報,其中各種關鍵資訊必須能夠被分析模組理解並進行加工,這就是處理模組的主要工作了。

這個資料處理模組主要的功能部分其實是自然語言處理,程式本身是無法理解語言內涵的,它肯定無法理解“定向增發100萬限售股”是什麼意思,這時候就需要認為給這句話進行賦值,讓它變成機器能夠理解的資料資訊。

比如首先進行意義分割,將定向設定為一個意義單元,將增發設定為另外一個單元,以這種方式將整個句子按照意義單元分割開來,分別進行賦值。

這一套加工手段裡面就牽扯到人機互動的語言處理問題,需要人為的幫助計算機去理解和處理人類的語言,讓機器能夠看懂語法、語意單元,能夠聯絡上下文,能夠處理不同語境下同一個片語的不同含義。

簡單來說,讓機器能夠理解人類語言,這就是自然語言的主要目標,同時也是這個處理模組的主要功能。

分析、收集、處理,這三大模組是股神10的主要功能結構,但是僅僅如此還是不夠的,股神還需要很多的輔助模組。

比如它需要有儲存模組,所有的資料資訊蒐集回來,必須整理加工好,然後分類儲存起來,它就像一個超級圖書館一樣,必須有自己的分類和儲存規則。如果沒有這些,你只是簡單的將它們堆放在一起,你就可以想象,當你需要從數千萬本書籍當中,找出某一頁特定內容時,那將會是怎樣一個痛苦而又恐怖的過程。

另外股神還需要相應的展示和互動模組,股神作為一個軟體,它需要有自己的操作介面,需要能夠將處理結果或者過程展現出來,需要能夠接收指令,進行人機互動。

這五個模組組合在一起,並且能夠順暢的相互配合了,股神系統才算基本成型,而中間肯定會有各式各類的問題不停冒出來,這都需要莫回逐個解決掉。在使用的過程中,肯定還涉及到不停的跟新和改良,所有這些都將是莫回的工作。

按照莫回的估算,整個股神的體量不太可能低於100萬行程式碼,如果想要讓股神儘可能的完美而準確,那它的體量絕對會翻著跟頭的往上翻。想要實現什麼功能,你就必須付出相應的代價,如果你想要讓股神的預測儘可能精確,那麼不停的往裡投入肯定是必不可少的。

這還僅僅是股神本身,如果想要股神運作起來,那麼莫回必然還將面臨著頻寬的問題,爬蟲一旦跑起來,海量資料就會被傳回,這些資料至少也是t級的。

在計算機領域,資料大小的單位是1024進位制的,一個位元組為byte,1024位元組為kb,1024k為,1024為g,1024g為t

比如我們手機的儲存容量可能是4g,筆記本的儲存容量可能是400g,而一臺筆記本的400g大概相當於一千部電影。

而股神透過爬蟲蒐集來的資料肯定是海量的,至少是t級別的,就是跑到p級別也不算是什麼大事。比如1p的資料,它大概相當於250萬部電影。人的一生也不過3萬天,每天看十部電影,也足夠看十輩子的了。

在如此大量的資料面前,莫回必然面臨一個頻寬問題,很容易想象,出租屋裡的小區寬頻肯定是不好使的。

目錄
熱血傳奇之開局簽到隱身戒指靈氣復甦:重生帶著大家一起飛
返回頂部