第四章 科研日常(第1/3 頁)
陳峰做的醫學影象處理領域的資料集少得可憐,這個很容易理解,跟醫藥相關的資料大多都是各大醫院的機密,論文作者不會輕易公開。
也就是因為陳峰的導師跟花城市第一人民醫院有專案合作,所以才能拿到部分相關資料。但拿到資料只是個開始,還需要陳峰自己進行資料處理。
凌志就沒這麼幸運了,他的研究方向跟社交媒體中的輿情分析有關,具體而言就是找出社交網路中的水軍,也就是屬於同一個現實世界人類的不同賬號。
他們透過多個賬號釋出垃圾評論擾亂社交網路秩序為樂,甚至有的商業機構會專門僱傭水軍發表負面言論攻擊競爭對手,影響十分惡劣。
水軍自然不會告訴你自己是水軍,而且社交網路的資料大多都很敏感,很少有人專門整理,所以這樣的資料集很難弄到。
凌志在過去一年的時間裡在資料集上花費了大量的時間,目前他所用的比較好的辦法是將同一個人釋出的推文分成2份,假裝是2個賬號釋出的,雖然不夠真實,但從做實驗的角度看足夠了。
凌志並不覺得有資料集和沒有資料集這兩種情況孰優孰劣,但凌志相信一句話,只要你付出,雖然不一定成功,但一定會有收穫。
所以儘管凌志在科研上進展緩慢,但採集社交網路資料的過程讓他掌握了資料採集、資料分析以及資料預處理等多項技能。
雖然他還算不上是處理資料領域的專家,但也算是積累了豐富的經驗。
“唉,話雖這麼說,但是內心還是很痛苦的呀,老哥。我自己覺得效果差不多了,但是我導並不放過我啊。”
“那算你倒黴,不過既然你導不滿意,目前來看也只能在資料處理上再下下功夫了啊。”
“只能這樣了,我回去再挑一挑資料,看看有沒有不乾淨的。”
“那你努力,需要幫忙跟我說一聲。”
“行,沒問題。那我先走了,拜拜。”
“拜拜。”
陳峰去了學院樓五樓,而凌志的實驗室在二樓,所以陳峰坐電梯上去,而凌志直接開11路走樓梯上去了。
時間還早,實驗室只來了一個人,周敏師兄。
周敏師兄比自己大1屆,預計明年畢業。研究方向是導師王海波的老本行,多目標車輛路徑最佳化問題。
老王在這個領域深耕了多年,發表多篇論文。底下弟子也帶過很多屆了,一開始都是做這個方向。而從周敏師兄這一屆開始,老王幡然醒悟,想要帶領部分學生在其他研究領域開荒,所以就有了凌志現在的研究方向。
凌志並沒有覺得有什麼不好,做老王的老本行也不見得萬事輕鬆,你的每一個實驗細節不到位都可能會遭受到王導的火眼金睛。開荒雖然也有開荒的難處,但是勝在能學到更多新知識,也有一定自由度。
有自由度並不是說可以隨意地編造實驗結果,這屬於學術造假,凌志是不會幹這種事的。實際上說的是你資料採集的量,處理到的程度,程式碼的引數設定等。
而當你用自己採集到的資料集以及自己編寫的程式碼跑出一個不錯的實驗結果時,即便這個實驗再簡單,你也會有無與倫比的成就感。
所以凌志對於自己的現狀非常滿足。
“早啊,周敏師兄。”
“早。”
邊說著,師兄打了一個大大的哈欠。凌志也沒在意,坐到自己的座位上,開啟電腦,準備將一篇跟詞向量相關的文章列印出來仔細看看。
實驗室配備有一臺專門的印表機,凌志拷好論文之後拿到印表機旁邊那臺電腦上插進去,可過了半天也沒讀出來盤。
“不對啊,應該不是我u盤壞了啊。”
凌志不知道哪裡