New York Times v. OpenAI:AI與新聞業的世紀對決

一、AI與新聞業的世紀對決

2023年 12 月,《紐約時報》(The New York Times, NYT)將 OpenAI 及其主要投資方 Microsoft 告上法庭,開啟了人工智慧時代最具里程碑意義的版權訴訟。

這場官司的結果,將重新定義「合理使用」(Fair Use)原則在 AI 訓練中的界限,並對全球新聞業的商業模式產生深遠影響。

二、紐約時報主張

紐約時報 對 OpenAI 提出的控訴,不僅僅是關於版權,更是關於一個耗資巨大的新聞機構如何被新興科技掠奪價值。

(一)核心:市場的實質性傷害

時報的主張圍繞三大核心:

1.版權侵權與非法複製

指控 OpenAI 在未經許可和付費的情況下,大量複製了數百萬篇時報的文章、深度調查和專業評論,用於訓練其大型語言模型(LLMs)。

2.市場替代與繞過付費牆

這是最關鍵的商業論點。時報認為,ChatGPT 等模型可以生成詳細、精確的時報文章摘要或解答,讓用戶無需訂閱或訪問時報網站即可獲得資訊價值,直接替代了時報的產品,造成數十億美元的潛在市場損失。

3.聲譽和商標損害

控訴 AI 偶爾出現的「幻覺」(Hallucinations),將捏造或錯誤的資訊錯誤地歸因於《紐約時報》,損害了其作為權威新聞來源的品牌聲譽。

(二)紐約時報證明侵權的關鍵證據

時報為了反駁 OpenAI 的「合理使用」辯護,提出了以下強而有力的證據:

1.逐字複製(Verbatim Reproduction)

時報展示了他們如何 #透過特定的提示語(Prompts),#誘導AI 模型完整地重現受版權保護的文章片段或全文。

這證明 AI 不只是「學習」了內容,而是能夠記憶並輸出原始作品,嚴重挑戰了「轉化性使用」的主張。

2.故意侵權

在證據開示階段,法庭文件據稱揭露了 OpenAI 內部通訊記錄,暗示 #員工討論過對盜版數據集相關證據進行刪除。時報利用這些訊息,主張 OpenAI 存在故意侵權行為,一旦此主張成立,其可尋求的法定賠償金將大幅增加。

三、OpenAI:堅守「合理使用」的防線

面對時報的訴訟,OpenAI 聯合 Microsoft 採取了堅決反駁的立場,將其辯護集中於法律、技術和行業慣例。

(一)法律辯護:轉化性使用

OpenAI 的核心論點是:使用公開數據訓練 AI 模型完全屬於版權法下的「合理使用」。

1.高度轉化性

他們認為訓練 AI 是一種「轉化性使用」,因為內容的用途發生了根本性變化,從供人類閱讀的敘事文本,變成了用於學習語言模式、語法結構和知識體系的原始數據。

2.罕見的錯誤

對於時報指控的「逐字複製」,OpenAI 承認這是一個「罕見的瑕疵」或「錯誤」,是 #工程師正在積極修復的問題,而 非故意設計的侵權行為。他們辯稱 #時報是透過不自然的刻意的提示來誘發這種行為

3.數據佔比極小

OpenAI 指出,時報的內容在他們數萬億詞彙的訓練數據集中佔比極少,無法構成實質性的侵權。

(二)商業模式:從競爭走向合作

OpenAI 試圖將自己定位為新聞業的潛在合作夥伴:

1.導流與引用

他們聲稱,ChatGPT 在輸出資訊時,有時會主動引用並提供連結至時報文章,實際上是為時報網站帶來了流量和潛在的付費訂閱用戶。

2.願意付費

OpenAI 強調他們已與美聯社(AP)等多家新聞機構簽訂授權協議,證明他們願意為內容付費,但 前提是價格合理。他們暗示時報的訴訟是企圖獲得不合理的、過高的利潤。

返回頂端