
將醫療影像用於訓練 AI 是一個非常重要且嚴肅的議題,這涉及法律、倫理及技術等多個層面。
簡單來說,答案是可以的,但必須嚴格遵守一系列的規範與限制。
一、關鍵考量因素
以下是幾個關鍵的考量因素:
(一)隱私保護與去識別化 (De-identification)
這是最核心的要求。在將醫療影像用於 AI 訓練之前,必須移除所有能識別病患身份的資訊(例如:姓名、身分證字號、生日、具體的住院日期,甚至是影像中可能出現的紋身或特殊首飾)。
- DICOM 標籤清理: 醫療影像格式 (DICOM) 的後設資料 (Metadata) 必須經過清理。
- 臉部遮蔽: 如果影像包含病患面部(如頭部 MRI/CT),通常需要進行去面部處理。
(二)知情同意 (Informed Consent)
根據不同國家的法規(如台灣的《個人資料保護法》、《人體研究法》,或歐盟的 GDPR),醫療機構通常需要事先徵得病患的同意,說明其影像可能會被用於醫學研究或軟體開發。
- 如果是過去收集的「去識別化」回溯性資料,在某些情況下經由「倫理審查委員會」(IRB) 核准後可豁免再次取得同意,但規範非常嚴格。
(三)IRB 倫理審查
任何涉及醫療資料的研究或開發計畫,通常都必須通過醫療機構內的 倫理審查委員會 (IRB) 審核。委員會會評估研究的必要性、對病患風險的控管,以及資料保護措施是否完善。
(四)法律與資料治理
- 資料不出院: 許多醫院為了安全,會要求 AI 開發者在醫院內部的伺服器進行訓練(即「聯邦式學習」或「在地訓練」),避免原始影像外流。
- 特定用途限制: 醫療影像通常只能用於申請時核准的特定研究目的,不能隨意轉售或用於非醫療相關的 AI 訓練。
(五)資料品質與標記
醫療 AI 的準確性高度依賴於「標記」(Labeling)。這需要放射科醫師或其他專家對影像中的病灶進行標註。若標記過程涉及外包,同樣需要確保資料傳輸的安全性。
合法合規的流程通常是:取得 IRB 核准,徹底去識別化,在受控環境下進行訓練,確保資料不被濫用。
二、醫院如何進行醫療影像的訓練?
目前台灣各大醫院(如台大、榮總、長庚、中醫大等)與政府單位主要透過以下幾種模式來進行:
(一)醫院內部的「AI 研發中心」
大型醫學中心通常設有專門的 AI 中心。
- 做法: 醫師與工程師合作,從院內影像系統 (PACS) 提取去識別化資料,在醫院內部的機房進行模型訓練。
- 優點: 資料不出院,資安風險最低。
- 實例: 台北榮總與台大醫院皆有利用 AI 輔助判讀肺部結節、腦中風影像,這些模型都是由院內資料訓練而成。
(二)健保署的「健保大數據開放」
台灣擁有全球罕見的健保資料庫。健保署近年與國發會合作,推動「健保影像 AI 應用計畫」。
- 做法: 健保署將去識別化的 CT、MRI 影像有條件地開放給產學界申請。
- 安全性: 研究人員必須進入健保署指定的「資料加值中心」,只能將訓練好的「模型參數」帶走,原始影像絕對帶不出去。
(三)「聯邦式學習」(Federated Learning) 模式
- 做法: 多家醫院協作訓練同一個 AI。「資料留在各自醫院,模型在雲端傳遞」。
- 實例: 台灣已有跨醫院聯盟利用此技術訓練新冠肺炎 (COVID-19) 的肺部 X 光自動判讀系統。
(四)法規面的管控
台灣醫院在處理這些影像時,必須遵守以下三道關卡:
- IRB (倫理委員會): 確保研究對病患無害,且個資保護措施到位。
- 去識別化: 必須符合衛服部的規範,不僅要抹除姓名,連影像邊角的條碼、病床號都要遮蔽。
- 退出權:隨著「資料治理」政策深化,保障民眾的「退出權」。
三、外部公司如何啟動研究?
(一)醫院合作案(適合開發新演算法)
- 取得 IRB 許可: 去識別化。
- 專業標記: 由醫師在影像上標註。
- 封閉訓練: 在醫院機房或國網中心提供的安全環境(如 TWS 台灣 AI 雲)訓練模型。
(二)國家級大數據(適合大規模預測研究)
如果您需要數萬名病患的長期追蹤資料:
- 申請「衛生福利資料科學中心」資料: 這裡有全台灣病患的健保就醫紀錄、處方藥物及部分影像標籤。
- 進駐分析: 您必須前往全台指定的獨立作業區(不能上網、不能攜出原始資料)進行運算。