使用醫療影像訓練AI模型面臨的法律問題

將醫療影像用於訓練 AI 是一個非常重要且嚴肅的議題，這涉及法律、倫理及技術等多個層面。

簡單來說，答案是可以的，但必須嚴格遵守一系列的規範與限制。

一、關鍵考量因素

以下是幾個關鍵的考量因素：

（一）隱私保護與去識別化 (De-identification)

這是最核心的要求。在將醫療影像用於 AI 訓練之前，必須移除所有能識別病患身份的資訊（例如：姓名、身分證字號、生日、具體的住院日期，甚至是影像中可能出現的紋身或特殊首飾）。

DICOM 標籤清理： 醫療影像格式 (DICOM) 的後設資料 (Metadata) 必須經過清理。
臉部遮蔽： 如果影像包含病患面部（如頭部 MRI/CT），通常需要進行去面部處理。

（二）知情同意 (Informed Consent)

根據不同國家的法規（如台灣的《個人資料保護法》、《人體研究法》，或歐盟的 GDPR），醫療機構通常需要事先徵得病患的同意，說明其影像可能會被用於醫學研究或軟體開發。

如果是過去收集的「去識別化」回溯性資料，在某些情況下經由「倫理審查委員會」(IRB) 核准後可豁免再次取得同意，但規範非常嚴格。

（三）IRB 倫理審查

任何涉及醫療資料的研究或開發計畫，通常都必須通過醫療機構內的 倫理審查委員會 (IRB) 審核。委員會會評估研究的必要性、對病患風險的控管，以及資料保護措施是否完善。

（四）法律與資料治理

資料不出院： 許多醫院為了安全，會要求 AI 開發者在醫院內部的伺服器進行訓練（即「聯邦式學習」或「在地訓練」），避免原始影像外流。
特定用途限制： 醫療影像通常只能用於申請時核准的特定研究目的，不能隨意轉售或用於非醫療相關的 AI 訓練。

（五）資料品質與標記

醫療 AI 的準確性高度依賴於「標記」(Labeling)。這需要放射科醫師或其他專家對影像中的病灶進行標註。若標記過程涉及外包，同樣需要確保資料傳輸的安全性。

合法合規的流程通常是：取得 IRB 核准，徹底去識別化，在受控環境下進行訓練，確保資料不被濫用。

二、醫院如何進行醫療影像的訓練？

目前台灣各大醫院（如台大、榮總、長庚、中醫大等）與政府單位主要透過以下幾種模式來進行：

（一）醫院內部的「AI 研發中心」

大型醫學中心通常設有專門的 AI 中心。

做法： 醫師與工程師合作，從院內影像系統 (PACS) 提取去識別化資料，在醫院內部的機房進行模型訓練。
優點： 資料不出院，資安風險最低。
實例： 台北榮總與台大醫院皆有利用 AI 輔助判讀肺部結節、腦中風影像，這些模型都是由院內資料訓練而成。

（二）健保署的「健保大數據開放」

台灣擁有全球罕見的健保資料庫。健保署近年與國發會合作，推動「健保影像 AI 應用計畫」。

做法： 健保署將去識別化的 CT、MRI 影像有條件地開放給產學界申請。
安全性： 研究人員必須進入健保署指定的「資料加值中心」，只能將訓練好的「模型參數」帶走，原始影像絕對帶不出去。

（三）「聯邦式學習」(Federated Learning) 模式

做法： 多家醫院協作訓練同一個 AI。「資料留在各自醫院，模型在雲端傳遞」。
實例： 台灣已有跨醫院聯盟利用此技術訓練新冠肺炎 (COVID-19) 的肺部 X 光自動判讀系統。

（四）法規面的管控

台灣醫院在處理這些影像時，必須遵守以下三道關卡：

IRB (倫理委員會)： 確保研究對病患無害，且個資保護措施到位。
去識別化： 必須符合衛服部的規範，不僅要抹除姓名，連影像邊角的條碼、病床號都要遮蔽。
退出權：隨著「資料治理」政策深化，保障民眾的「退出權」。

三、外部公司如何啟動研究？

（一）醫院合作案（適合開發新演算法）

取得 IRB 許可： 去識別化。
專業標記： 由醫師在影像上標註。
封閉訓練： 在醫院機房或國網中心提供的安全環境（如 TWS 台灣 AI 雲）訓練模型。

（二）國家級大數據（適合大規模預測研究）

如果您需要數萬名病患的長期追蹤資料：

申請「衛生福利資料科學中心」資料： 這裡有全台灣病患的健保就醫紀錄、處方藥物及部分影像標籤。
進駐分析： 您必須前往全台指定的獨立作業區（不能上網、不能攜出原始資料）進行運算。