使用醫療影像訓練AI模型面臨的法律問題

將醫療影像用於訓練 AI 是一個非常重要且嚴肅的議題,這涉及法律、倫理及技術等多個層面。

簡單來說,答案是可以的,但必須嚴格遵守一系列的規範與限制。

一、關鍵考量因素

以下是幾個關鍵的考量因素:

(一)隱私保護與去識別化 (De-identification)

這是最核心的要求。在將醫療影像用於 AI 訓練之前,必須移除所有能識別病患身份的資訊(例如:姓名、身分證字號、生日、具體的住院日期,甚至是影像中可能出現的紋身或特殊首飾)。

  • DICOM 標籤清理: 醫療影像格式 (DICOM) 的後設資料 (Metadata) 必須經過清理。
  • 臉部遮蔽: 如果影像包含病患面部(如頭部 MRI/CT),通常需要進行去面部處理。

(二)知情同意 (Informed Consent)

根據不同國家的法規(如台灣的《個人資料保護法》、《人體研究法》,或歐盟的 GDPR),醫療機構通常需要事先徵得病患的同意,說明其影像可能會被用於醫學研究或軟體開發。

  • 如果是過去收集的「去識別化」回溯性資料,在某些情況下經由「倫理審查委員會」(IRB) 核准後可豁免再次取得同意,但規範非常嚴格。

(三)IRB 倫理審查

任何涉及醫療資料的研究或開發計畫,通常都必須通過醫療機構內的 倫理審查委員會 (IRB) 審核。委員會會評估研究的必要性、對病患風險的控管,以及資料保護措施是否完善。

(四)法律與資料治理

  • 資料不出院: 許多醫院為了安全,會要求 AI 開發者在醫院內部的伺服器進行訓練(即「聯邦式學習」或「在地訓練」),避免原始影像外流。
  • 特定用途限制: 醫療影像通常只能用於申請時核准的特定研究目的,不能隨意轉售或用於非醫療相關的 AI 訓練。

(五)資料品質與標記

醫療 AI 的準確性高度依賴於「標記」(Labeling)。這需要放射科醫師或其他專家對影像中的病灶進行標註。若標記過程涉及外包,同樣需要確保資料傳輸的安全性。

合法合規的流程通常是:取得 IRB 核准,徹底去識別化,在受控環境下進行訓練,確保資料不被濫用。

二、醫院如何進行醫療影像的訓練?

目前台灣各大醫院(如台大、榮總、長庚、中醫大等)與政府單位主要透過以下幾種模式來進行:

(一)醫院內部的「AI 研發中心」

大型醫學中心通常設有專門的 AI 中心。

  • 做法: 醫師與工程師合作,從院內影像系統 (PACS) 提取去識別化資料,在醫院內部的機房進行模型訓練。
  • 優點: 資料不出院,資安風險最低。
  • 實例: 台北榮總與台大醫院皆有利用 AI 輔助判讀肺部結節、腦中風影像,這些模型都是由院內資料訓練而成。

(二)健保署的「健保大數據開放」

台灣擁有全球罕見的健保資料庫。健保署近年與國發會合作,推動「健保影像 AI 應用計畫」。

  • 做法: 健保署將去識別化的 CT、MRI 影像有條件地開放給產學界申請。
  • 安全性: 研究人員必須進入健保署指定的「資料加值中心」,只能將訓練好的「模型參數」帶走,原始影像絕對帶不出去。

(三)「聯邦式學習」(Federated Learning) 模式

  • 做法: 多家醫院協作訓練同一個 AI。「資料留在各自醫院,模型在雲端傳遞」
  • 實例: 台灣已有跨醫院聯盟利用此技術訓練新冠肺炎 (COVID-19) 的肺部 X 光自動判讀系統。

(四)法規面的管控

台灣醫院在處理這些影像時,必須遵守以下三道關卡:

  • IRB (倫理委員會): 確保研究對病患無害,且個資保護措施到位。
  • 去識別化: 必須符合衛服部的規範,不僅要抹除姓名,連影像邊角的條碼、病床號都要遮蔽。
  • 退出權:隨著「資料治理」政策深化,保障民眾的「退出權」。

三、外部公司如何啟動研究?

(一)醫院合作案(適合開發新演算法)

  1. 取得 IRB 許可: 去識別化
  2. 專業標記: 由醫師在影像上標註。
  3. 封閉訓練: 在醫院機房或國網中心提供的安全環境(如 TWS 台灣 AI 雲)訓練模型。

(二)國家級大數據(適合大規模預測研究)

如果您需要數萬名病患的長期追蹤資料:

  1. 申請「衛生福利資料科學中心」資料: 這裡有全台灣病患的健保就醫紀錄、處方藥物及部分影像標籤。
  2. 進駐分析: 您必須前往全台指定的獨立作業區(不能上網、不能攜出原始資料)進行運算。
返回頂端