

一、Kadrey v. Meta(2025)背景事實
此判決處理了 Meta 使用來自「影子圖書館」的書籍來訓練其 Llama 生成式人工智慧模型是否構成侵權(是否構成合理使用)的問題。
判決結論: 有利於 Meta (被告)。
法院認為 ,Meta 的訓練行為具有高度的轉化性,但著作權法的首要目標是防止市場替代,未經許可使用著作權資料來訓練人工智慧模型,很可能會造成市場稀釋(market dilution)而違法。
然而,在這起特定的訴訟中,法院最終對 Meta 做出有利判決,指出原告作者未能提供足夠的確鑿證據來證明 Llama 模型的輸出對其作品造成實際或預期的市場損害。
法院明確表示,儘管法院在原則上認同著作權人的擔憂,但著作權人未來需要更具體的證據才能成功挑戰 AI 模型訓練的合法性。
(以上為AI生成並經改寫)
由這個判決可以看得出來,合理使用四要素當中,就是第一個和第四個最重要。
根據我過去讀的美國法院判決以及一些美國學者資料,也是這樣認為。
所以以後我們分析二要素就好XD
合理使用第一個要素:高度轉化
在第一個要素當中,在台灣可能是商業非商業目的而重要,但美國向來是「是否具備轉化性」重要,如果高度轉化,就算是商業目的也可以是合理使用。AI模型使用著作權資料被認為是高度轉化。
合理使用第四個要素:作者未能證明間接市場替代(市場稀釋)
第四個要素則是非常重要,市場替代的概念,也就是,到底有沒有生成相同會類似的作品而影響到原作者的實際利益和潛在利益。
在這個案子裡面,美國法官認為第四個要素最重要,原告也針對第四個要素提出三個主張。
但被告提出了一些很有力的證據,包括:AI模型沒辦法生成整本書、AI模型推出後,原告的作品銷量並沒有下降,所以沒有發生市場替代。
法院認同AI模型可以生成出一些類似作品(例如AMAZON上面已經出現很多AI寫的書),像洪水一樣多,導致消費者可能買AI書,而不買作者書,而可能會造成市場取代。看得出來法院很想判作者贏,但法院認為,作者必須要提出更多的實際證據,法院才能給作者勝訴判決。
二、合理使用四要素分析:
(以下為AI生成)
(一)使用之目的與性質 (The Purpose and Character of the Use)
此要素分析: 有利於 Meta (被告)。
• 高度轉化性 (Highly Transformative): 法院認為 Meta 複製原告書籍的目的是為了訓練其 LLM。這種使用具有「更進一步的目的」與「不同的性質」。LLM 是一種創新工具,可用於生成多樣文本並執行廣泛功能(例如:翻譯、撰寫程式碼或商業報告),這與原告書籍「供閱讀以娛樂或教育」的目的截然不同。
• 非人類閱讀模式: LLM 對文本的吸收方式與人類閱讀不同。LLM 是透過分析單詞之間的「統計模式」來學習,而非像人類一樣閱讀內容。
• 商業性質 (Commercial Nature): Meta 的使用具有商業性質。雖然 Llama 可免費下載,但其開發目的是商業性的,預計在未來十年內將產生數千億甚至數兆美元的收入。商業性通常會不利於合理使用認定,但由於 Meta 的使用具有高度轉化性,因此商業性並未使要素一傾向原告。
• 來源爭議 (影子圖書館): 儘管原告指控 Meta 從「影子圖書館」(shadow libraries)下載資料涉及「盜版」,但法院指出,此行為必須根據其最終的、高度轉化性的目的(即訓練 Llama)來考量。
(二)著作權作品之性質 (The Nature of the Copyrighted Work)
此要素分析: 有利於原告。
• 富有表達性的作品: 原告的書籍(主要為小說、回憶錄和戲劇)是「高度富有表達性的作品」,屬於著作權法旨在保護的核心類型。即使是事實類作品(如自傳),著作權仍保護作者「表達事實的方式」。
• 非僅提取功能性元素: Meta 試圖援引「中間複製」(intermediate copying)的先例,主張其僅使用了書籍的「功能性元素」。但法院駁回此論點,因為 LLM 訓練依賴於書籍的創造性表達,包括單詞順序、詞頻、語法和句法。若訓練數據的品質不高,LLM 將無法產生高品質的文本。
• 權重較輕: 法院同時指出,此要素很少在合理使用爭議中扮演重要角色。
(三)所用份量之多寡與實質性 (The Amount and Substantiality of the Portion Used)
此要素分析: 有利於 Meta (被告)。
• 複製全部具有合理性: 儘管 Meta 複製了原告的全部書籍,但這個數量與其轉化目的的關係是合理的。LLM 訓練需要大量且高品質的資料,因此使用整本書比只使用一半更能有效地訓練模型。
• 非直接替代: 由於 Llama 模型無法輸出任何有意義份量的原告書籍文本(即使使用「對抗性提示」(adversarial prompting),輸出量也不會超過 50 個詞和標點符號),因此複製整本書並未增加其作為原著「直接替代品」的可能性。
(四)對潛在市場或著作權作品價值之影響 (The Effect of the Use Upon the Potential Market)
此要素分析: 有利於 Meta (被告) (基於原告於本案(未能)提出的證據)。
• 核心重要性: 此要素被認為是合理使用分析中「無疑是單一最為重要的因素」。鑑於要素一強烈傾向 Meta,原告必須在要素四上「決定性地獲勝」才能推翻合理使用抗辯。
• 原告的三種市場損害理論:
1. 直接替代(作品還原)(Direct Substitution/Regurgitation)X
失敗。由於 Llama 無法還原原告書籍的任何實質性部分,因此不構成市場威脅。
原告主張, Llama 模型能夠還原(regurgitate)原告書籍的實質性部分或生成極為相似的文本,導致用戶免費取得原作品或替代品。
但專家證詞顯示,即使使用旨在讓 LLM 吐出訓練資料的「對抗性提示」(adversarial prompting)方法,Llama 模型也無法生成超過 50 個詞和標點符號的內容。
2. 授權市場受損 (Licensing Market Harm)X
失敗。著作權人無權壟斷對其作品進行「轉化性目的」使用的授權市場。如果將此類授權市場受損視為合理的傷害,將會使要素四的分析陷入循環論證。
原告主張, Meta 未經授權複製原告作品用於 AI 訓練,損害了原告將其作品授權給 LLM 訓練的潛在市場。
法院認為,這樣的主張有循環論證風險,因為如果將此類市場定義為原告受法律保護的市場,將會導致第四要素分析陷入循環,使得每次轉化性使用都將對市場造成損害。
3. 市場稀釋(間接替代)?(Market Dilution/Indirect Substitution)?
最具潛力的論點,但證據不足而失敗。
原告主張,LLM 能夠快速生成大量與原告作品在主題或類型上相似、但本身不構成侵權的競爭作品,從而「稀釋」了原告作品的市場。
間接替代的性質: 法院明確指出,間接替代仍是「替代」。如果消費者購買 LLM 撰寫的浪漫小說而不是人類作者的浪漫小說,這就是一種替代。
AI 的獨特威脅: 法院認為,LLM 訓練與過往案例不同,它有潛力以「極少的時間和創造力」生成「數百萬計的次級作品」,這種潛力是前所未有的,使市場稀釋概念變得高度相關。
訓練的重要性: 法院認為,訓練 LLM 使用受著作權保護的書籍,使其比僅訓練公共領域作品的模型更有能力產生競爭性作品,從而加劇市場稀釋的威脅。
證據缺陷(導致失敗的原因): 法院認為,儘管理論強大,但原告在證據方面表現「非常薄弱」。
缺乏實證證據: 原告未能提出任何經驗證據來證明 Meta 的模型(Llama)已經造成或預計會造成市場稀釋。他們沒有對其書籍的市場進行分析,也沒有解釋 AI 生成的書籍(例如「正在充斥亞馬遜」的那些書籍)如何與他們的特定作品(例如 Sarah Silverman 的回憶錄或 Matthew Klam 的短篇小說集)競爭。
被告的反駁證據: Meta 提出了證據,表明 Llama 3 發佈後,原告書籍的銷量在短期內沒有受到可察覺的影響。
無法推論損害: 由於 Meta 的使用是高度轉化性的,且不涉及直接複製,市場損害不能僅憑推論得出(與 Hachette 案不同)。要得出損害結論,需要一系列複雜的推論,例如:Llama 模型(而不僅僅是任何 LLM)將被用於創造競爭性書籍,且消費者將會購買這些 AI 書籍來替代原告的特定書籍。
此要素分析: 由於原告提出的證據僅為臆測,不足以構成實質性事實爭議,故該理論無法在簡易判決階段成功。
(五)結論
法院認為,儘管 LLM 訓練具有高度潛力造成市場稀釋(間接替代),但由於這十三位原告未能提供足夠的證據來證明這種損害已經發生或即將發生,因此法院只能根據現有記錄,裁定合理使用抗辯成立,並判決 Meta 在該特定訓練複製行為上獲得簡易判決勝訴。此判決不代表 Meta 使用受著作權保護材料來訓練 LLM 是合法的,僅表示這幾位原告「提出了錯誤的論點,且未能就正確的論點提出支持證據」。
——————————————————————————–
(六)類比說明
如果合理使用是一場天秤的較量,那麼 Meta 的「高度轉化性」(要素一)就像一塊非常重的砝碼,讓天秤傾向被告。在這種情況下,原告必須在天秤的另一端放置一塊更大、更重、且經過證實的「市場損害」(要素四)砝碼才能勝訴。雖然原告的律師提出了「市場稀釋」(AI 洪水)這個非常有說服力的理論(像是一塊潛在的大砝碼),但他們在訴訟中未能提供足夠的具體經驗數據來證明 Llama 已經造成或即將造成具體損害。因此,法院只能判決 Meta勝訴。
三、追伸:若人工智慧訓練需授權,集體授權機制如何有效率發展及運作?
(以下為AI生成)
人工智慧開發商若需避免侵權責任,通常需要為其使用的受著作權保護材料支付授權費用。
然而,Meta 平台公司在嘗試取得書籍授權用於 Llama 模型訓練時,遇到了巨大的物流和法律挑戰,這突顯了當前集體授權機制發展的障礙,同時也暗示了未來有效運作的方向。
(一)當前集體授權機制發展的挑戰
Meta 曾嘗試與幾家主要出版商進行授權交易,甚至討論撥出高達一億美元用於授權。但最終,Meta 放棄了這些授權努力,轉而從「影子圖書館」(shadow libraries)下載資料,原因正是授權在物流上過於困難。
資料中指出了集體授權在 AI 訓練數據市場中難以有效運作的幾個關鍵障礙:
1. 缺乏集體授權組織
目前沒有組織負責此類權利的集體授權。
2. 權利分散於個別作者
出版商通常不持有將書籍授權用於 AI 訓練的附屬權利(subsidiary rights)。這些權利反而通常由個別作者持有。
3. 地域性限制
即使出版商確實持有 AI 訓練的授權權利,這些權利通常也是區域性的,而非全球性。
這導致了著作權人無法透過單一實體進行集中協商,且 AI 開發商難以逐本書籍、逐個作者地協商授權,造成物流上的巨大困難。
集體付費機制有效發展及運作的潛在方式
(二)集體授權機制的可能發展
法院推測,如果 AI 訓練必須取得授權,市場將會被驅動,最終會找出解決這些物流問題的方法。高效的集體付費機制將需要朝以下方向發展和運作:
1. 轉向大規模授權 (Large-Scale Licensing)
AI 模型訓練需要大量且多樣的文本資料。因此,單本書的價值可能相對較低,難以證明逐本協商授權交易是合理的。
若要實現效率,集體付費機制必須朝向一次性授權大量書籍的方向發展。
2. 出版商聚集權利並進行大規模協商
若法律裁定 AI 訓練使用受著作權保護的書籍是非法複製,開發商唯一的選擇是取得授權,這將創造強大的經濟誘因來重塑市場結構:
• 出版商的角色: 出版商預計將開始與其作者協商,取得將書籍用於 LLM 訓練的附屬權利。
• 大規模談判: 一旦出版商(或新成立的權利組織)聚集了這些權利,他們就能夠與 LLM 開發商進行大規模的談判和授權,這將遠比 Meta 過去遇到的逐個作者或逐本書籍的談判更為高效。
3. 經濟誘因的驅動
推動集體付費機制發展的根本原因在於 AI 技術預期將帶來巨大的經濟利益。
• 高額收入預期: 這些產品預計將為開發公司產生數十億甚至數萬億美元的收入。
• 支付意願: 由於書籍被認為對 LLM 訓練特別有價值,如果使用受著作權保護的作品是必要的,開發商將會找到補償著作權人的方法。例如,Meta 自己就曾願意為授權付費,只是發現流程太過繁瑣。
總結來說,集體授權機制若要有效率地發展和運作,必須解決當前權利分散於個別作者、缺乏集體授權組織以及地域性限制的問題。
解決方案可能在於出版商開始積極與作者取得 AI 訓練的附屬權利,並與 LLM 開發商進行大規模的、集中式的授權和談判。