第181頁(第1/2 頁)
劉教授重複剛才的操作,說:「是的。」
言謹提出下一個問題:「那請問劉教授,這種差異是怎麼產生的呢?」
劉教授笑,說:「這就是個複雜的問題了,每家公司採用的模型不同,進行預訓練的資料集也不同。」
言謹客氣致謝,再次提問:「那麼是否存在一種可能,有些 ai 繪圖工具並未能達到您所說的『把資料庫真的學會了,生成的結果確實是一種全新創造』的程度呢?」
劉教授滯了滯,答:「這個要具體情況具體分析……」
言謹並未打算糾纏,但郭家陽那邊已出聲打斷,對法官說:「原告律師的提問存在引導專家的傾向,請求法庭準許我方輔助人不回答這個問題。」
法官支援了他的意見,看向言謹,提醒她注意提問的方式。
言謹致歉,她其實可以換一種方式重新提問,卻出乎對方意料地說:「原告沒有其他問題了,申請請上我方的專家輔助人。」
法官點頭準許,劉教授順利完成任務,退出法庭,換了原告方聘請的林博士坐到中間的輔助人席位上。
林博士不過三十幾歲,自我介紹身份以及資歷,是個資料法領域的學者,正在做人工智慧監管方面的理論研究。
雙方專家輔助人的名單也是庭前就提交了的,同樣都是明牌。言謹可以猜到郭律師和孫力行看到名單時的反應。他們或許會覺得她蠢,因為美國那個同類案件之所以首戰失利,除去兩位藝術家沒做版權登記,還有一個原因就是原告方沒能把為什麼認為 ai 繪圖工具侵權的邏輯解釋清楚。而言謹似乎也在犯同樣的錯誤,居然請了一個法學學者來做 ai 案件的專家輔助人,等於白白浪費掉了唯一的外援機會。
這一次,由言謹先提問,她再次開口,仍舊是方才那個問題:「請問林博士,ai 繪圖工具生成的內容是否存在複製拼接資料集作品的可能?」
這是早就預演過的流程,林博士要求使用大螢幕,在上面展示材料,同時簡述其中的內容:「我這裡有一篇馬裡蘭大學和紐約大學聯合研究團隊的論文,題目叫《擴散藝術還是數字偽造?》,研究了擴散模型當中的過度擬合和資料複製現象。結論指出,一款當下著名的 ai 繪圖工具生成的內容與資料集作品的相似度超過 50的可能性達到了 188。也就是說,每一百幅 ai 生成的圖片當中,就有將近兩幅存在一半以上的複製的現象。而且,訓練資料集的大小在很大程度上影響著這個複製率,在使用具體藝術家姓名或者「某某某風格」作為提示詞的情況下,這種複製拼接尤其明顯,甚至可能達到贗品的程度。」
結論和資料再次引起旁聽席上輕微的騷動,被告那邊郭家陽和孫力行倒是不覺得意外,這篇論文在今年六月份溫哥華國際計算機視覺與模式識別會議的推薦閱讀清單裡,相關行業的人應該都讀過。他們只是側首低語,顯然已經在準備稍後的詰問。
言謹並未停頓,提出下一個問題,說:「那您是否同意方才劉教授的觀點,對人工智慧發起著作權訴訟,會造成反公共地悲劇,為它的發展設定人為障礙?」
林博士搖頭,同樣上了一波價值,說:「反公共地悲劇的另一面,是公共地悲劇。這個詞第一次出現是在哈定的著作中,描述的是 15、16 世紀英國的圈地運動。貴族佔有公地放牧,造成牛羊數量無節制地增加,直至牧場成為不毛之地,農民和牧民失去維持生計的方式。史稱『羊吃人』事件,但其實牛羊也都餓死了,其中真正獲利的只有圈地的貴族。這個例子與 ai 侵權的爭議也有相似之處,倘若任其無序發展,藝術家就像圈地運動中的農民,牧民就像使用 ai 工具搶奪他們工作機會的人。但當藝術家停止創作,資料集中不再有人