【綜合外電報導】國際學術期刊《自然》最新發表一篇健康科學的研究論文提醒,數據被用於訓練醫療人工智慧(AI)模型的個人,可能面臨在網路攻擊中被識別的風險。這項研究表明,代表性不足群體面臨的資料外洩風險可能更高。論文作者指出,目前的風險評估並未將這些群體納入考量,因此,他們呼籲採取進一步的風險緩解措施並實施嚴格的存取控制。
論文介紹,醫療AI模型有望改善全球健康狀況,特別是在缺乏專業人才的地區。然而,用於訓練這些模型的敏感資料可能面臨隱私攻擊。攻擊者利用成員推理攻擊(MIA)來確定個人的資料是否被用於訓練模型。透過此類攻擊,可以推斷出患者的醫療數據和私人資訊。先前關於資料風險的研究主要基於整個資料集,並未考慮個體的風險。
論文第一作者和通訊作者、德國慕尼黑工業大學Moritz A. Knolle與同事及合作者開展了一項隱私審計,重點關注個人隱私風險,發現醫療AI模型可能對個人資料貢獻者構成隱私風險。他們利用七個由真實臨床數據(包括醫學影像、心電圖和電子健康記錄)組成的大型數據集,確定了數據貢獻患者中最為脆弱的群體。
論文作者發現,在個人層面,成員推理攻擊針對的目標幾乎毫無差錯地被成功識別出來;在群體層面,在數據集中被識別為代表性不足的群體,包括罕見病患者、少數族裔或社會經濟地位較低的人群,以及性別較不常見的人群。隨著被AI模型編碼的獨特數據增多,研究發現這些群體和個人更加脆弱,且面臨不成比例的隱私攻擊風險。同時,成員推理攻擊者攻擊的成功率會隨著模型容量和規模的增加而上升。

















你必須登入才能發表留言。