New York Times v. OpenAI：AI與新聞業的世紀對決

一、AI與新聞業的世紀對決

2023年 12 月，《紐約時報》（The New York Times, NYT）將 OpenAI 及其主要投資方 Microsoft 告上法庭，開啟了人工智慧時代最具里程碑意義的版權訴訟。

這場官司的結果，將重新定義「合理使用」（Fair Use）原則在 AI 訓練中的界限，並對全球新聞業的商業模式產生深遠影響。

二、紐約時報主張

紐約時報對 OpenAI 提出的控訴，不僅僅是關於版權，更是關於一個耗資巨大的新聞機構如何被新興科技掠奪價值。

（一）核心：市場的實質性傷害

時報的主張圍繞三大核心：

1.版權侵權與非法複製

指控 OpenAI 在未經許可和付費的情況下，大量複製了數百萬篇時報的文章、深度調查和專業評論，用於訓練其大型語言模型（LLMs）。

2.市場替代與繞過付費牆

這是最關鍵的商業論點。時報認為，ChatGPT 等模型可以生成詳細、精確的時報文章摘要或解答，讓用戶無需訂閱或訪問時報網站即可獲得資訊價值，直接替代了時報的產品，造成數十億美元的潛在市場損失。

3.聲譽和商標損害

控訴 AI 偶爾出現的「幻覺」（Hallucinations），將捏造或錯誤的資訊錯誤地歸因於《紐約時報》，損害了其作為權威新聞來源的品牌聲譽。

（二）紐約時報證明侵權的關鍵證據

時報為了反駁 OpenAI 的「合理使用」辯護，提出了以下強而有力的證據：

1.逐字複製（Verbatim Reproduction）

時報展示了他們如何 #透過特定的提示語（Prompts），#誘導AI 模型完整地重現受版權保護的文章片段或全文。

這證明 AI 不只是「學習」了內容，而是能夠記憶並輸出原始作品，嚴重挑戰了「轉化性使用」的主張。

2.故意侵權

在證據開示階段，法庭文件據稱揭露了 OpenAI 內部通訊記錄，暗示 #員工討論過對盜版數據集相關證據進行刪除。時報利用這些訊息，主張 OpenAI 存在故意侵權行為，一旦此主張成立，其可尋求的法定賠償金將大幅增加。

三、OpenAI：堅守「合理使用」的防線

面對時報的訴訟，OpenAI 聯合 Microsoft 採取了堅決反駁的立場，將其辯護集中於法律、技術和行業慣例。

（一）法律辯護：轉化性使用

OpenAI 的核心論點是：使用公開數據訓練 AI 模型完全屬於版權法下的「合理使用」。

1.高度轉化性

他們認為訓練 AI 是一種「轉化性使用」，因為內容的用途發生了根本性變化，從供人類閱讀的敘事文本，變成了用於學習語言模式、語法結構和知識體系的原始數據。

2.罕見的錯誤

對於時報指控的「逐字複製」，OpenAI 承認這是一個「罕見的瑕疵」或「錯誤」，是 #工程師正在積極修復的問題，而非故意設計的侵權行為。他們辯稱 #時報是透過不自然的刻意的提示來誘發這種行為。

3.數據佔比極小

OpenAI 指出，時報的內容在他們數萬億詞彙的訓練數據集中佔比極少，無法構成實質性的侵權。

（二）商業模式：從競爭走向合作

OpenAI 試圖將自己定位為新聞業的潛在合作夥伴：

1.導流與引用

他們聲稱，ChatGPT 在輸出資訊時，有時會主動引用並提供連結至時報文章，實際上是為時報網站帶來了流量和潛在的付費訂閱用戶。

2.願意付費

OpenAI 強調他們已與美聯社（AP）等多家新聞機構簽訂授權協議，證明他們願意為內容付費，但 前提是價格合理。他們暗示時報的訴訟是企圖獲得不合理的、過高的利潤。