
一、要點說明
此授權規範的核心要點如下:
(一)授權目的與定義
- 推動 AI 研發: 旨在促進以人為本的 AI 研發,提升在地文化價值並加速語料流通。
- 語料範疇: 涵蓋語文、音樂、美術、攝影、視聽、錄音等作品,亦包含具創作性的編輯著作。
- 角色關係: 定義了授權人(提供者)、被授權人(接收者)以及「語料平台」(負責依授權人指示橋接第三方,但非授權關係當事人)。
(二)授權範圍與權限
- 必要使用權: 授權人授予被授權人對語料進行重製、改作、編輯等必要權利,以使其合法用於 AI 訓練。
- 限制: 此項授權具排他性,明確規定不得再授權與轉讓。
- 期間: 授權期間可由授權人指定為特定年份或永久有效。
(三)訓練成果的權利歸屬
- 成果所有權: 透過學習或訓練所得之產出(如模型、權重、程式碼等),若具著作權保護要件,權利歸屬於被授權人或模型操作者所有。
- 後續利用不受影響: 即使原語料停止提供使用,也不影響已完成的訓練成果(模型與權重等)之效力與後續利用。
- 訴訟豁免: 除特殊情形外,授權人同意不將 AI 訓練成果視為原著作之改作或編輯,並同意不對相關產出之利用行為施加限制或提出訴訟。
(四)異常情形之約束
- 合理範圍限制: 若 AI 訓練成果在內容上與原語料實質近似,且對原語料市場價值造成負面影響,並超出合理學習範疇時,仍可能受原著作權拘束。
二、臺灣主權AI訓練語料授權條款-第1版
前言:
為促進以人為本的人工智慧(AI)研發與應用,增進公眾利益、提升在地文化價值,並促進自然語料的永續發展,特訂立本授權條款,以加速並提倡相關資料之流通。
一、名詞定義
1.授權人:指具備合法權利的個人或單位,依據本授權條款提供其所管理之語料資料予被授權人,以協助被授權人在被明確同意的基礎下,使用該等語料資料於人工智慧的訓練與學習。
2.被授權人:指接收並依據本授權條款使用語料資料之收受者。
3.語料資料:本條款所稱語料資料,包含但不限於可用於AI語言與多模態學習之語文、音樂、美術、攝影、圖形、視聽、錄音等作品,亦包含具創作性之資料選擇與編排所得之編輯性著作。
4.語料平臺:指由授權人處取得語料資料,復依授權人指示,橋接將語料資料以授權人名義提供予被授權人之第三方。語料平臺依本條款之設計,非屬授權關係任一造之當事人,然得經授權人之同意,為其評估與擇定語料資料供作人工智慧訓練應用之收受對象或有效期間。
二、授權同意
1.授權人依本條款提供之語料資料,授予被授權人重製、改作、編輯及其他著作權和著作相關權利上必要之使用權,使其合法用於AI訓練。此項授權不得再授權與轉讓,有效期間得由授權人或其代表人指定為特定年份或永久。
2.被授權人依前揭訓練所得之成果,包括但不限於採學習或訓練方式,產出相應之模型、權重與生成程式碼、文件或其他型態的輸出成果,若具著作權保護要件,應歸屬於被授權人或模型操作者所有,相關產出或輸出之著作權利人,並得就該等成果後續進行完整的適法性利用。即使原語料資料後續停止提供使用,不影響已完成之訓練成果,包括但不限於所產出之模型、權重,以及程式碼、文件或其他型態之輸出。
3.惟當該等成果在內容上與原語料實質近似,且對原語料資料市場或價值造成負面影響,並超出合理學習範疇時,仍可能受原著作權拘束。
4.除前項情形外,授權人同意不將AI訓練成果視為其著作之改作或編輯,並同意不會對相關產出與輸出之後續使用、修改、再散布或運算行為,施加任何限制或提出訴訟。
三、標示義務
1.除非依法免除或經授權人另行同意,於語料資料之應用型態為模型、權重等工具或輸出平臺之產出時,被授權人應標示語料平臺,就該語料資料提供之相關識別資訊,例如資料集名稱、版本號、資料集提供者、發布年份、資料集申請頁面或官方網站、或其他經授權人指定之格式化引用資訊,以及指出係依「臺灣主權AI訓練語料授權條款-第1版 (Taiwan Sovereign AI Training Data License–Version 1.0)」發布之狀態,此一授權資訊之呈現,得標示授權條款正式全稱,例如:「「臺灣主權AI訓練語料授權條款-1.0-有效期間至2030年」、「臺灣主權AI訓練語料授權條款-1.0-有效期間為永久」、”SAITD-Lic-Taiwan-1.0-Valid until 2030”、”SAITD-Lic-Taiwan-1.0-Valid in perpetuity”。
2.鑒於人工智慧訓練涉及多元來源之語料資料混用,授權人同意就本授權條款發布之語料資料,進行識別資訊標示時,被授權人僅需就語料平臺提供之語料資料庫或資料集名稱,及其他相關識別資訊進行標示,毋須就本授權語料資料內含個別素材,如語文、音樂、美術、攝影、圖形、視聽、錄音等客體進行逐項標示。
3.於語料資料之應用型態為程式碼、文件等型態之輸出時,相關標示義務得視媒介或載體之限制,採更為簡化之方式為之。例如採人工智慧軟體模型或服務平臺進行輸出執行,後續輸出成果於公開演播或展示時,應註明其為「人工智慧生成產出」等資訊,以彰顯資訊或可能偏離事實或應另行查找權威資訊以資確認。
四、使用政策
1.被授權人應就語料資料之使用成果,包括人工智慧訓練之產出與輸出,於合理範圍內設置適當防護機制,以避免與原語料資料產生實質近似,或肇生著作權侵害,以降低對原語料資料市場或價值產生潛在負面影響之風險。
2.被授權人同意使用依本授權提供之語料資料,涉及下列法律及倫理爭議行為時,應自負其責,授權人不因提供語料資料,而被認為對該等行為有表達同意、許可或核准之意思表示: (1) 違反國際或當地法規; (2) 傷害未成年人或依法應受特別保護之人; (3) 製造虛假資訊; (4) 用於個人資訊追蹤; (5) 用於污蔑、誹謗或騷擾; (6) 偽裝他人身份; (7) 侵犯他人合法權利; (8) 對特定族群進行歧視或傷害; (9) 對特定群體的弱點進行分析並加以傷害; (10) 用於法律禁止的專業用途(如醫療或其他法律保留之相關行為等)。
五、免責聲明
1.基於免授權金之授權基礎,授權人僅對語料資料所擁有的著作權和著作相關權利地位進行明確主張,並同意語料資料可供人工智慧訓練使用,但對其他事項不提供任何擔保。
2.除非另行明示保證,授權人提供語料資料時不作任何形式的保證,無論明示或默示,亦不保證資料的商業性、適用性、無侵權爭議狀態等。
3.授權人對使用資料所引發的任何直接或間接損失不負責任,即使已被告知該損失的可能性。
4.以上免責及責任限制條款應以最大範圍解釋,將授權人相關責任免除。
六、其他事項
1.本條款之正體中文版本及英文版本皆為正式文本,具有同等法律效力。
2.所指定之授權有效期間,截止至該年度全球最晚時區之最後一日。
3.本授權條款不預立準據法與管轄法院,如發生爭議,授權人與被授權人雙方應本於誠信原則共同協議解決,若仍有未盡事宜需進行司法調解或爭訟,橋接資料之語料平臺,將本於協助資料共享中立平臺之立場,不參與任何一方發動之爭議程序。
4.本授權條款之文本,不主張著作權利而歸於公眾領域,任何人得依本授權條款之文本進行修改版本之創建,然前提應更改授權條款名稱,且不得與本授權條款原發布單位有關之出處描述與名稱產生連結,以避免混淆。
七、與其他資料授權條款之搭配
1.本授權條款得因應不同情境之推廣策略,經語料資料之授權人指定,與其他資料授權條款或處分宣告搭配使用。當與其他資料授權條款搭配使用時,本條款作為容許相關資料,得用於人工智慧訓練與後續應用之額外補充聲明。於本條款作為其他條款之額外補充聲明時,並不增設其他條款所無之使用限制,然當其他條款具更嚴格授權義務限制時,可依本條款放寬之,例如依本條款之寬鬆標準實踐標示義務。
2.於搭配使用之情境,相關語料資料之授權對象、授權期間、授權目的及得否再散布或再授權之處理,應依該其他授權條款之規範。而得列入何款其他資料授權條款,作為搭配選項,則依橋接訓練資料之語料平臺政策核定。
3.其他資料授權條款,對原語料資料之後續使用,或設有相關限制(如時間、地域、姓名標示、非商業性、禁止改作、相同方式分享等),然配合本授權條款之額外容許,當應用模式係採人工智慧訓練,而產出或輸出與原資料不具著作表達實質近似之成果時,授權人同意依本條款第二條之規劃,不對相關成果之後續應用,設定任何拘束與限制。
4.本授權條款與其他授權條款之搭配,乃就其他授權條款規範未清之處,依授權人之意表達其意願指示,明確補充其所提供之語料資料,得供人工智慧訓練及其後成果產出或輸出之利用。倘依此搭配機制收受資料之被授權人,認其使用情境已無人工智慧訓練與應用之必要,或有將該資料合併其他未具人工智慧訓練與應用允許資料之需求,則可由被授權人自行移除此額外容許,嗣後單採其他授權條款之規範,就該等語料資料進行利用。
5.於本授權條款與其他資料授權條款之搭配情境,就其授權資訊之呈現,得標示本條款與所搭配之其他授權條款正式全稱,或採授權條款簡稱嵌入條款出處「統一資源識別符」(URI)或超連結方式表述之,如下列舉例:「CC授權-姓名標示-非商業性 + 臺灣主權AI訓練語料授權條款-1.0」、”CC-BY-ND-with-Taiwan-AI-training-exception-1.0”。