
一、AI與新聞業的世紀對決
2023年 12 月,《紐約時報》(The New York Times, NYT)將 OpenAI 及其主要投資方 Microsoft 告上法庭,開啟了人工智慧時代最具里程碑意義的版權訴訟。
這場官司的結果,將重新定義「合理使用」(Fair Use)原則在 AI 訓練中的界限,並對全球新聞業的商業模式產生深遠影響。
二、紐約時報主張
紐約時報 對 OpenAI 提出的控訴,不僅僅是關於版權,更是關於一個耗資巨大的新聞機構如何被新興科技掠奪價值。
(一)核心:市場的實質性傷害
時報的主張圍繞三大核心:
1.版權侵權與非法複製
指控 OpenAI 在未經許可和付費的情況下,大量複製了數百萬篇時報的文章、深度調查和專業評論,用於訓練其大型語言模型(LLMs)。
2.市場替代與繞過付費牆
這是最關鍵的商業論點。時報認為,ChatGPT 等模型可以生成詳細、精確的時報文章摘要或解答,讓用戶無需訂閱或訪問時報網站即可獲得資訊價值,直接替代了時報的產品,造成數十億美元的潛在市場損失。
3.聲譽和商標損害
控訴 AI 偶爾出現的「幻覺」(Hallucinations),將捏造或錯誤的資訊錯誤地歸因於《紐約時報》,損害了其作為權威新聞來源的品牌聲譽。
(二)紐約時報證明侵權的關鍵證據
時報為了反駁 OpenAI 的「合理使用」辯護,提出了以下強而有力的證據:
1.逐字複製(Verbatim Reproduction)
時報展示了他們如何 #透過特定的提示語(Prompts),#誘導AI 模型完整地重現受版權保護的文章片段或全文。
這證明 AI 不只是「學習」了內容,而是能夠記憶並輸出原始作品,嚴重挑戰了「轉化性使用」的主張。
2.故意侵權
在證據開示階段,法庭文件據稱揭露了 OpenAI 內部通訊記錄,暗示 #員工討論過對盜版數據集相關證據進行刪除。時報利用這些訊息,主張 OpenAI 存在故意侵權行為,一旦此主張成立,其可尋求的法定賠償金將大幅增加。
三、OpenAI:堅守「合理使用」的防線
面對時報的訴訟,OpenAI 聯合 Microsoft 採取了堅決反駁的立場,將其辯護集中於法律、技術和行業慣例。
(一)法律辯護:轉化性使用
OpenAI 的核心論點是:使用公開數據訓練 AI 模型完全屬於版權法下的「合理使用」。
1.高度轉化性
他們認為訓練 AI 是一種「轉化性使用」,因為內容的用途發生了根本性變化,從供人類閱讀的敘事文本,變成了用於學習語言模式、語法結構和知識體系的原始數據。
2.罕見的錯誤
對於時報指控的「逐字複製」,OpenAI 承認這是一個「罕見的瑕疵」或「錯誤」,是 #工程師正在積極修復的問題,而 非故意設計的侵權行為。他們辯稱 #時報是透過不自然的刻意的提示來誘發這種行為。
3.數據佔比極小
OpenAI 指出,時報的內容在他們數萬億詞彙的訓練數據集中佔比極少,無法構成實質性的侵權。
(二)商業模式:從競爭走向合作
OpenAI 試圖將自己定位為新聞業的潛在合作夥伴:
1.導流與引用
他們聲稱,ChatGPT 在輸出資訊時,有時會主動引用並提供連結至時報文章,實際上是為時報網站帶來了流量和潛在的付費訂閱用戶。
2.願意付費
OpenAI 強調他們已與美聯社(AP)等多家新聞機構簽訂授權協議,證明他們願意為內容付費,但 前提是價格合理。他們暗示時報的訴訟是企圖獲得不合理的、過高的利潤。