顯示具有 資料 標籤的文章。 顯示所有文章
顯示具有 資料 標籤的文章。 顯示所有文章

2025年6月15日 星期日

醫療器材導入人工智慧和機器學習的前瞻指引

楔子

運用機器學習(ML, Machine Leraning)在醫療診斷和治療過程時,既提供醫療建議,又收集臨床應用資料,已經變得越來越普遍,考慮到各國法規要求和產品標準的多方交錯複雜性,卻未及時呈現如人工智慧(AI, Artificial Intelligence)的較新技術可能帶有的機會與風險。醫療器材產業急需有關設計和開發使用人工智慧與機器學習時,能夠結合ISO 14971醫療器材風險管理過程等國際標準保持一致性的指引文件。

美國的醫療器材促進協會(AAMI)及時伸出援手,在2023年3月出版技術報告,供醫療器材製造商參考運用,建構整合人工智慧與機器學習的風險管理過程。略感欣慰之事係該指引並不提供新的風險管理過程或擴展ISO 14971:2019已有的要求。
© All Rights reserved. 版權聲明

指引名稱:

  • AAMI TIR 34971:2023 Application of ISO 14971 to machine learning in artificial intelligence ‒ Guide 《ISO 14971 在人工智慧內機器學習中的應用—指引》
  • BS/AAMI 34971:2023 Application of BS EN ISO 14971 to machine learning in artificial intelligence ‒ Guide 《ISO 14971 在人工智慧內機器學習中的應用—指引》
圖1:指引目錄

背景資訊

在產品中使用機器學習模式,必然會帶給最終使用者大量潛在的新風險、不能預見和不熟悉的風險。

場景1:風險分析時,必然從識別和記錄器材及描述預期使用開始。但是,如果係稱器材使用人工智慧與機器學習模組,則風險小組提出關於預期使用和可預見的錯誤使用的情境,顯然不宜侷限在既有之醫療器材的情境和過往經驗得知的問題。

該指引可以提供幫助,指出可能需要提出哪些面向的問題,例如:
  • 是否為提供診斷或治療建議的軟體?
  • 哪些資訊對受到影響的使用者甚為重要?
  • 系統是否告知或主動通知該等資訊給利益相關者?
  • 器材是否具備臨床管理機制?
  • 臨床實務上,系統是否提供相同功能的非機器學習方式的選項?
  • 該器材是否具有自適應功能,如:監督、量測、取樣?
  • 該器材的自主治理能力與程度位於何種範圍?
  • 該器材是否具有與時俱進的學習能力? 操作者是否可以調整其性能及應用特性嗎?
    • 如果可以,是哪些調整?
    • 該類調整是否有限制範圍?
    • 是否受到監督?
  • 如果該系統具有與時俱進的學習能力,是否有可能會影響其預期使用方式?
該指引第5.3節,識別安全有關的特徵,文中提供大量有關使用人工智慧和機器學習時要注意的相關資訊。

圖2:機器學習的應用面向






資料管理 Data Management

資料管理的領域跨越廣闊的範圍,該指引樂於提出需要考慮某些特定問題:資料完整性、一致性和正確性。資料品質和模型複雜度對於效能、風險、適用性和泛化會有何種影響?此處取決於係稱器材的具體情況。有鑒於本諸機器學習的醫療器材在提供給患者使用前,需要對收集來的資料進行「訓練」,因此牽連到資料管理相關的風險有很多項。

儘管可以列出冗長的名單,指引中提供幾種器材的示例,並提示將該等問題納入風險管理活動的一部分。其中一些最關鍵的問題如下(非完整列出):
  • 資料不正確
  • 資料不完整
  • 資料中異常值的處理不正確
  • 不一致的資料,因為來自不同的源頭,例如:
    • 受個人信念或觀點影響的主觀資料
    • 不足以代表器材實際使用中資料品質的典型資料
有缺陷的資料可能會導致 人工智慧與機器學習模型的效能惡化,以及與此等資料品質問題密切相關的各型各類危險,且資料屬性的設定與歸併須納入風險管理過程,包括用於減輕其對績效和安全衝擊的控制措施。指引另外提出「偏差/方差權衡」的問題,此問題是開發 人工智慧與機器學習模型時的一個基本問題,以及需要妥切地考慮管制模型開發複雜性的問題。

偏差 Bias

考慮偏差是醫療和科學研究必不可少事項之一,以及醫療器材產品開發生命週期所需的統計學嚴謹性的基本支柱之一,當涉及採用機器學習的醫療器材的性能時,偏差是潛在風險的主要來源。該指引適當地關照,雖然眾人皆曾感受到偏差可能會對模型表現產生正面和負面的衝擊,儘管並非所有偏差本質上都會產生負面效果,但宜於考慮許多不同的方法以訓練機器學習演算法的資料,指引中詳細討論幾種具體可以衝擊 人工智慧與機器學習模型的偏差類型,如:
  • 隱含偏差
  • 選擇偏差
  • 非正常狀況
  • 代理變量
  • 來自實驗者的偏差
  • 來自分組歸因的偏差
  • 混雜交錯的變量
該指引重點地介紹資料缺失、樣本偏差(當資料並非隨機收集而來時)和覆蓋偏差(當資料與目標群體未能匹配時),將如何導致選擇偏差,從而對產品安全性和有效性可能造成潛在的風險。考慮合宜的緩解措施,該指引建議在資料收集結束階段執行資料集查證,以確保資料集對應預期對象的適宜程度、適切性及適當分佈。此外,器材製造商亦須考慮並評估偏差如何在開發階段之外引入危險和危險情況。例如:宜評估識別風險等級的決策器材的人機使用者介面的設計,以確保模型報告通過計算而來的風險之方法不會引入偏差,或者引起/造成使用者b遭受不當影響。

資料存儲、安全性和隱私性 Data storage/security/privacy

資料儲存、安全性和隱私性已成為所有組織的關切焦點,因為忽視或淡然面對之將會帶來業務和法規風險。 人工智慧與機器學習式的醫療器材有什麼特別之處?在網路安全方面,該指引舉出一個針對醫學影像分類器的對抗性攻擊的衝擊為例,其中細微的影像變化可能導致完全不同的高置信度分類。雖然將家貓誤分類為酪梨醬是個有趣的誤會,但其影響遠大於僅止是將家貓錯誤分類為酪梨醬一事的單純危害,雖然機器學習模組運作的任務,從程式設計上看是相同的步驟,並且承辦人員可以在網際網路上免費獲得分類時會用到的軟體工具。機器學習應用程序的開發、測試和訓練中使用的資料,可能是懷有隱密惡意參與者的誘惑性目標。

正如該指引所指出的示例,儘管由於機器學習模式的不透明性質,即使採取多角度方式確保網路安全的技術將適用於機器學習,但個別情況的差異性及不定期發生的機率,可能很難檢測安全性何時受到損害;亦即意味著任何在其器材中使用機器學習的醫療器材公司都需要維持監督其產品的性能,並採取適當因應措施以確保個人敏感性或隱私資料免除不當的侵犯。

過度信任 Overtrust

過度信任是指使用者對技術產生信心的趨勢,當人們對科技的依賴超出工具現有的能力,即即使某種操作情境顯然提醒使用者應該持懷疑態度,使用者寧願選擇依賴技術並信任該技術,以至於不自覺地將患者置於不確定的風險時,就會出現過度信任的危險。 當使用者:
  • 對應用程序的能力產生超過合理程度的信心。
  • 承擔的風險低於實際面對的風險,並委託給機器學習的模組逕行處理。
  • 當工作量很大時。沒有時間自己做某件事,或未能仔細檢查工作成果時,有很大可能賦予信任機器學習的應用程序。
  • 對自身處理任務的能力略顯信心不足,遂提出申請機器學習的應用模組。
該指引舉出若干情境下可能浮現的不同場景,以及需要進行後繽監督以確定何時可能發生這種情況,以便採取適當的對應措施。該指引提出一個有意義的補強點,建議揭露對 人工智慧與機器學習性能的信心,可以採用之以供過度信任情境的風險控制措施,因為設置的防範措施將擷取和錨定使用者對器材性能的期望。該措施的有效性可以作為開發期間可得性評估的一部分,納入任務執行時的評估和量化指標,並配合監督部署後的運作狀況。

自適應系統 Adaptive systems

與不會隨著時間變更設定事項的傳統軟體系統不同,隨著時間的推移不斷學習的自適應系統能夠在部署後繼續從新的觀察中學習,持續不斷地收集應用期間的資料,因此理所當然地受到了醫療產業、主管機關及利益相關者的特別關注,因為此項功能代表人工智慧與機器學習系統的獨特功能。這對醫療器材的變更控制提出了新的挑戰。雖然並非所有 人工智慧與機器學習系統都能夠做到這一點,但該指引 建議採用自我查證、回溯和上市後查證過程等選擇型項目,對自適應算法進行連續查證的方法,如果性能超出法規、標準或現今科技實務的約束型指標,則可能允許該系統退回到先前通過查證的模型及軟體版本。以防止具備此種功能的自適應系統醫療器材所帶來的風險。

整體剩餘風險

風險管理過程的關鍵部分是評估整體剩餘風險。對於任一種醫療器材來說,此步驟都是一個相對較為困難的過程,而採用人工智慧/機器學習的器材進一步增加了挑戰的難度。該指引為此另提供一些建議,關於如何執行此種評估。為了使用者、稽核員和主管機關在內的所有利害關係人之需,大致說來,宜考慮:
  • 記錄演算法結果;
  • 挑選、決定及預測閾值的影響;
  • 公平性測試和挑選合宜的效能指標;
  • 展示各項控制措施的合理性;
  • 須嘗試量化選擇的管制措施產生的剩餘風險;
  • 模型輸出結果的可解釋性;
  • 在可能的情況下,須適當地記錄有關特徵權重的資訊。
該指引亦包括有關從風險分析中長年累積得到的經驗,有利地應用於風險評鑑、風險控制、剩餘風險評鑑,風險管理審查以及生產和後生產活動的資訊。

再次強調,對於使用機器學習的醫療器材,儘管上述特徵可能是唯有機器學習模組才有的安全相關事項,但並不需要改變ISO 14971中敘述的風險管理過程。

TIR34971附件中包含哪些內容?
該指引附件提供對本文提到的概念和示例,配合相關的說明內容。
  • 附件A 敘述合ISO 14971的風險管理流程,在瀏覽技術報告時值得作為參考。
  • 附件B 提供與機器學習相關的危害情況示例,以及此等危害情況的相互關係、可預見的事件序列、危險情況、危害和風險控制措施。
    • B.1 與機器學習相關的危險示例
    • B.2事件與狀況示例
    • B.3 危險、可預見事件序列、危險狀況、傷害及潛在風險控制措施的相關性示例
  • 附件C 指定使用具有機器學習組件的器材適當執行風險管理過程可能需要的人員資格,以滿足人員適任性要求。
  • 附件D 涵蓋自適應系統的注意事項。係風險管理的重要組成部分,因為系統中的自主層級會影響器材的風險。具有某些特定程度的自適應系統醫療器材,將需要特定的風險控制措施,以確保其安全性和有效性。
    • D.1 IMDRF SaMD分類
    • D.2 採用SaMD分類於自適應系統的可能性

結語

雖然此文僅討論該指引涵蓋的幾個事項,但關於醫療器材帶有人工智慧與機器學習的風險管理過程方面,顯然還有很多需要嘗試、探索、理解、消化及融合的地方。該指引的及時出現提供了揭露人工智慧與機器學習相關風險的視角和緩解工具,採用類似於ISO 14971:2019及 ISO/TR 24971:2020 的章節,可供製造商在風險管理過程中將之文件化。隨著越來越多基於人工智慧與機器學習的醫療器材在全球範圍內放入市場,還有更多的新型或添加機器學習的醫療器材正在開發中,該指引值得醫療器材產業界的重視與採用。

(本篇竟)

2025年6月12日 星期四

人工智慧醫療器材術語初輯(四之四)

© All Rights reserved. 版權聲明

宙、資料與資訊一般辭彙

序號

名詞

定義與說明

1

資料採擷

data mining

對於定量資料,通過從不同視角和維度分析、分類並總結潛在的聯繫和影響,以此提取模式的計算過程。

從大量資料中發現有價值資訊的過程。涉及運用統計學、機器學習和人工智慧技術來分析資料集,以識別模式、趨勢和關聯,此等資訊通常是隱含的,無法通過簡單查詢或手動分析得以發現。

2

人員考核personnel examination

是為了保證標注人員/仲裁人員的能力與標注要求一致的測試過程。

3

資產asset

對個人或組織有價值的任何東西。

4

攻擊 Attack

(人工智慧)破壞、洩露、篡改、損傷、偷竊、未授權訪問或未授權使用資產的企圖。旨在破壞或利用人工智慧系統的完整性、可用性和機密性。攻擊大致分為若干類型:對抗攻擊、後門攻擊、模型萃取攻擊、成員推理攻擊、模型逆向攻擊、資料隱私洩露、惡意軟體檢測與防禦入侵、對抗樣本防禦。

5

真實性Authenticity

一個實體正是其所聲稱實體的特性。

係為人工智慧系統的真正智慧或真實智慧的體現。涉及人工智慧是否能夠理解其環境、獨立思考、進行推理、自主學習、基於理解的情境做出決定、從而解決問題,以及在複雜情境中表現出與人類智慧相仿的能力,而不僅僅是通過預程式設計的規則、資料的統計模式或簡單的資料處理而逕行預測、制式回應或完成既定任務。

6

授權Authorization

獲得訪問資料和功能的許可權。

(人工智慧)授權過程是人工智慧系統獲取訪問特定資源或執行特定任務許可權的過程。在人工智慧應用中,授權可以涉及到用戶查證、代理者身份查證、許可權控制和訪問權限管理等面向。

7

利用 Exploit

明確用於通過漏洞破壞資訊系統安全的方法。

8

抗抵賴性

Non-Repudiation

證明所聲稱事態或行為的發生及其發起實體的能力,以解決有關事態或行為發生與否以及事態中實體是否牽涉的爭端。

源自資訊安全領域概念,係指通訊雙方在資料交換過程中,確保發送方不能否認已發送的資料,接收方不能否認已接收的資料。此概念強調資料的不可抵賴性,通常通過數位簽章、加密和時間戳記等技術手段予以實現。

應用階段確保機器學習模型的訓練資料、演算法參數以及模型輸出的完整性和可信度。

註:亦稱「非否認性」。

9

隱私 Privacy

不因不正當或非法收集和使用有關個人的資料而侵犯其私人生活或事務的自由

10

個人資訊 personal information

以電子或者其他方式記錄的能單獨或者與其他資訊結合識別特定自然人身份或者反應特定自然人活動情況的各種資訊。例如:姓名、身份證件號碼、通信/通訊聯繫方式、住址、帳號密碼、財產狀況、行蹤軌跡等。

註:亦稱「個人隱私資訊」。

11

個人一般資訊 personal general information

個人敏感資訊以外的個人資訊。

12

存取控制 access control

基於業務要求和安全要求,確保授權和受限的訪問資產的手段。

13

脆弱性vulnerability

可能會被威脅所利用的資產或控制措施的弱點。

1:亦稱《脆弱度》、《易受傷害性》、《易損性》、《漏洞》。

2:脆弱性可能位於物理環境、組織結構、業務過程、人員、管理、硬體、軟體及通訊設施等面向。

3:脆弱性是與資產緊密相連,是資產本身具備的、可能受到威脅利用的弱點。威脅須利用脆弱性才會對組織造成危害。

14

[電子]欺騙 spoofing

假冒成合法的資源或用戶

通過偽造或篡改資料、輸入或身份,欺騙人工智慧系統使其產生錯誤判斷或行為的技術。此種攻擊可能針對模型的輸入、訓練資料或系統交互環節,目的是誤導人工智慧以達到惡意目的。通常欺騙行為的途徑與方式如

l   輸入欺騙:以精心構造的輸入項目,可能是圖像、音訊、文本,誘使人工智慧系統的模型出現偏差或產生誤判。

l   毒性訓練資料:攻擊者隱瞞、篡改、潛藏模型的訓練資料,植入竄改後的偏差或後門程式,在特定情境時俟機促發模型依循設定步驟動作、改變途徑、引導干涉或直接失效。

l   身份欺騙:偽造人類的生物特徵:如人類臉孔模態、指紋樣式、聲紋、視網膜,欺騙誤導人工智慧的身份查證系統。

l   對抗性攻擊:利用模型漏洞蓄意生成對抗性樣本,通常針對深度學習模型。

l   系統交互型欺騙:模仿合法使用者或醫療器材,與人工智慧系統交互作用。

可行之因應對策,如:宜增強輸入檢測、引入健壯性訓練、運用多參數查證、輸入輸出資料的重複查證等。

15

威脅threat

可能導致對系統或組織的損害的不期望事件發生的潛在原因。

16

專家系統 expert system

一種基於知識的系統,他根據由人類專家經驗開發出的知識庫進行推理,來解決某一特定領域或應用範圍中的問題。

17

醫學圖像分割 medical image segmentation

一種醫學影像處理方法,根據臨床治療或研究需求把醫學圖像分成若干個特定的、具有獨特性質的區域,並提取出圖像中包括器官、病灶等感興趣目標的技術和過程。

18

醫學圖像分類medical image classification

一種醫學影像處理方法,根據醫學圖像資訊中所反映的不同特徵,對不同類別的醫學圖像進行分類。

19

醫學圖像配准medical image registration

一種醫學影像處理方法,將不同時間、空間、模態採集的醫學圖像通過演算法映射到另一個坐標系的過程。

20

醫學圖像目標檢測medical image object detection

一種醫學影像處理方法,從醫學圖像中找出包括病灶、器官、組織等在內的感興趣的目標,並確定其位置和類別。

21

醫學圖像成像加速 Medical imaging acceleration

一種醫學圖像成像技術,通過超解析度重建、低劑量重建等加速演算法提高各種醫學成像設備的成像速度。

22

醫學圖像模態轉換Medical imaging modality transformation

醫學影像處理方法之一,從一種影像模態轉換到另一種影像模態。旨在增強醫學影像診斷的準確性、效率和患者體驗。有鑑於不同成像技術的物理特性及臨床應用互有長短,如:CT的高分辨率宜於骨骼成像,但須防範電離輻射效應;MRI適宜於軟組織對比成像,但掃描時間長致使成本增加;超音波適宜即時成像但依賴操作者經驗判斷潛在可疑部位。大致分為七個應用考量面向:

1.       影像分析與診斷:人工智慧演算法,特別是深度學習模型,能夠從CTMRIX光等影像資料中提取複雜特徵,輔助醫生查看、評估及判斷疾病檢測和診斷。

2.       影像融合與轉換:通過人工智慧技術,不同模態的醫學影像可以被融合和轉換,以提供更全面的病灶資訊。這種多模態融合不僅提高了診斷的準確性,還為個性化治療方案提供了依據。例如,人工智慧整合CTMRI影像資料,生成更為詳細和準確的三維重建圖像,供醫生更直觀地理解病變區域。

3.       圖像增強與去噪:人工智慧技術可以增強醫學影像的清晰度,減少雜訊,使得細微結構更易被識別。在低劑量CT掃描中尤為重要,可以減少輻射暴露同時保持診斷品質。

4.       自動化與智慧化:人工智慧醫療器材能夠自動化完成部分影像分析任務,如分割腫瘤邊界、量化病變體積等,減輕醫生的工作負擔,提高工作效率。同時,這些系統能夠提供即時回饋,輔助醫生做出決策。

5.       可解釋性與透明度:隨著人工智慧在醫學影像中的廣泛應用,提高模型的可解釋性和透明度成為研究熱點。例如,中山六院的研究團隊構建的基於Vision Transformer的模型,不僅預測直腸癌患者的生存率,還能解釋其預測結果的依據,增強醫生對人工智慧輸出的信任。

6.       法規與符合性:儘管人工智慧技術在醫學影像領域展現出巨大潛力,但其應用仍需遵循嚴格的法規要求。美國食品藥品監督管理局(FDA)已批准多種基於人工智慧和機器學習的醫療器材,尤其在放射學領域。此等器材的開發、評估和臨床應用皆需符合相關法規,確保安全性和有效性。

7.       成本效益與普及性:人工智慧醫療器才的發展亦需考慮成本效益,以促進醫療領域的廣泛應用。通過提高診療效率、減少誤診和漏診,人工智慧技術有望降低醫療成本,提升醫療服務的可及性和品質。

 

 

 

洪、資料集一般辭彙

序號

名詞

定義與說明

1

計數檢驗inspection by attributes

關於規定的一個或一組要求,或者僅將單位產品劃分為合格或不合格,或者僅計算單位產品中不合格數的檢驗。

2

計量品質特徵 variable quality characteristics

被檢的單位產品特性能用連續尺度進行度量的品質特性。

3

計量抽樣檢驗 sampling inspection by variables

按規定的抽樣方案從批中隨機抽取一定數量的單位產品。用測量、試驗或其他方法取得它們的質量特性值,與品質要求進行對比,並判斷該批產品能否接收的過程。

4

lot

按抽樣目的,在基本相同條件下組成的總體的一個確定部分。

5

保全[] security

對電腦硬體、軟體進行的保護,以防止其受到意外的或蓄意的存取、使用、修改、毀壞或洩密。保全性也涉及對患者隱私、元資料、通訊以及電腦安裝的實質性保護。

6

資訊保全information security

對資料進行的保護,以防止其受到意外的或蓄意的存取、使用、修改、毀壞或洩密。
保全性也涉及對受試者隱私、元資料、通訊以及電腦安裝的物理保護。

註:亦稱《信息保全[]》。

7

可攜性 portability

資料集能被安裝、替換或從一個系統移動到另一個系統中,並保持已有品質的屬性的程度。

註:亦稱《可攜性》。

8

離群值outlier

在一組資料中,被認為與該組其他觀察值具有明顯不同特徵的那些觀察值。

註:亦稱《異常值》。

9

資料集描述 dataset description

陳述資料集各種性質的文件。

 

 

 

荒、資料集標注辭彙`

序號

名詞

定義與說明

1

標注任務 annotation task

(a)  按照資料標注規範對指定資料集進行標注的過程。

(b)  有目的地對一批資料進行分析、添加外部知識的活動。

2

標注對象 annotation object

標注任務分析的具體資訊,如:資料的類型、特徵、屬性等。

 

3

標注工具 annotation tool

用於輔助標注/仲裁人員產生標注結果的一系列軟體/硬體工具。

4

標注平臺 annotation platform

開展標注任務的資訊管理系統

5

標注規則 annotation instruction

資料需求方用於明確標注任務和標注資料的操作規範,應包含標注物件定義、所用標注工具和標注 平臺、標注格式、標注前的準備工作、標注後的處理工作等。

6

結構化標注 structured annotation

使用固定的格式、固定的規則記錄結果的標注任務。

7

非結構化標注 non-structured annotation

使用不固定的格式、不固定的規則記錄結果的標注任務。

8

半結構化標注 semi-structured annotation

使用固定的格式、不固定的規則記錄結果的標注任務。

 

9

手工標注 manual annotation

完全由人工執行的標注任務。

10

自動標注 automatic annotation

完全由機器執行的標注任務,標注完成後由人工審查。

11

半自動標注 semi-automatic annotation

(a)由人工和機器混合完成的標注任務。

(b)使用人工結合自動化工具的方式進行資料標注。

12

語義標注 semantic annotation

以資料代表的涵義和關係為標注對象的標注任務。

13

標注人員 annotator

具備完成特定任務目標、並滿足品質要求的適任能力、執行標注任務、對標注結果有直接貢獻的人員。

1:包括初級標注人員、審查人員、仲裁人員等。

2:通常情況,要求人員的適任能力,仲裁人員高於審查人員,審查人員高於初級標注人員。

14

初級標注人員 initial annotator

執行標注任務、做出初步標注結果的人員。 

15

審查人員 annotation reviewer

對初步標注結果進行審查與品質管制的人員。

16

仲裁人員 arbitrator

當多名標注人員對同一資料的標注結果不一致時,負責做出最終結果的人員。

17

標注人員績效 annotation performance

標注人員執行標注任務的能力表現。

18

標注責任組織annotation responsible organization

組織各項活動展開標注任務、對標注品質負擔直接責任的實體。

19

標注流程annotation process

產生標注結果需要遵循的步驟。

註:通常包含《依次標注》和《獨立標注》兩種過程,《依次標注》過程首先由初級標注人員進行標注,然後其標注結果交由審查人員進行審核,如審查人員認可該結果,則該結果成為最終的標注結果,否則交由仲裁人員通過仲裁方式決定最終的標注結果。《獨立標注》過程係分別由若干名標注人員,各自獨立對原始資料進行標注,然後將各人的標注結果經由仲裁方式產生最終的標注結果。

 

 

 

日、預訓練模型辭彙

序號

名詞

定義與說明

1

預訓練模型pre-trained model

已在資料集上經過訓練的計算模型,可用作新任務的基礎.

註:預訓練模型狹義上通常用於遷移學習,其中模型在一個源任務上進行預訓練,然後在下游任務上進行微調;在 廣義上,預訓練模型可能作為機器學習模型的初始值,供下游任務進行微調.

2

預訓練模型說
pre-trained model description

陳述預訓練模型各種性質的文件.

3

任務域task domain

機器學習模型需要解決的特定問題或任務的領域.

註:在人工智慧醫療器材的應用中任務城的示例有:影像病灶檢測、影像學徵象分類、影像R(OI(感興趣區域)分 割、超聲視頻分割、影像報告生成、心電信號檢測、圖像生成、流程優化等.

4

源任務source task

用於訓練機器學習模型的初始任務.

5

對抗訓練Adversarial Training

通過添加對抗樣本來訓練模型的一種方法,用於提高模型對抗性的能力。

6

生成模型 generative model

一種通過學習資料分佈,專注於資料集的分佈,以返回給定示例的概率,來生成新的資料樣本的深度學習模型,如VAEGAN等。

7

變分自編碼器Variational Autoencoder, VAE

一種深度學習模型,由一個編碼器和一個解碼器組成;前者學習將重要的潛在變數與訓練資料隔離開來,再由後者使用這些潛在變數重建輸入資料。能以訓練所輸入資料的變體形式生成新資料。除此之外,VAE亦可執行其他自編碼器常見的任務,例如去噪。

8

生成對抗網路Generative Adversarial Network, GAN

一種通過對抗生成和判別模型來生成逼真的資料樣本的深度學習模型。

GAN主要應用目標承擔生成式任務,如:生成、重建、超分辨率、風格遷移、補全、上採樣等;由生成器生成網路,通過輸入生成圖像,再由判別器執行二次分類,將生成器生成圖像作為負樣本,真實圖像作為正樣本,再由學習生成器使得由判別器對生成圖像的評分盡可能接近正樣本作為目標來訓練,迭代執行,使生成器產生的結果愈來愈逼真。

9

判別模型 discrimination model

一種通過學習類別之間的界限,基於條件概率對看不見的資料進行預測,來分類資料樣本,主要用於監督學習任務。它直接對輸入資料和輸出標籤之間的關係進行建模,目標是學習一個函數或概率分佈,能夠準確地區分不同類別的資料。判別模型專注於預測資料的標籤,而不是生成資料的分佈。可用於分類或迴歸問題陳述的深度學習模型,CNN卷積類神經網路)RNN遞迴類神經網路)等。判別模型的優點在於可以利用較少的資料進行訓練,並且在相同量的訓練資料下,通常比生成模型具有更好的實際效果。然而,判別模型無法生成新的資料實例,且對異常值的處理可能不如生成模型。

10

卷積類神經網路Convolutional Neural Network, CNN

一種深度學習算法,主要用於處理具有網路結構的資料,如圖像、影像處理和電腦視覺的深度神經網路,能夠自動學習資料中的空間特徵,採用卷積操作提取圖像特徵。由卷積層、池化層及全連接層組成。

l   卷積層:使用卷積核(篩檢程式)對輸入資料進行局部連接和權值共用,提取局部特徵,如邊緣和紋理。

l   池化層:通過下採樣減少特徵圖的維度,提高對輸入變化的魯棒性,通常使用最大池化。

l   全連接層:將特徵圖展開為一維向量,進行分類或迴歸計算。

經過局部感知和權值共用,有助於減少參數量,降低過擬合風險,並高效處理圖像資料。通過堆疊多層卷積和池化操作,可以構建深層網路,從而捕捉更複雜的特徵。

11

遞迴類神經網路Recurrent Neural Network, RNN

一種適用於序列資料處理的深度神經網路,由輸入層、一個隱藏層和一個輸出層組成,通過迴圈連接來保留先前的狀態資訊。

12

多層感知器 multilayer perception, MLP

一種最早提出的前向結構的人工神經網路,映射一組輸入向量到一組輸出向量,由多個全連接層組成。每一層都全連接到下一層。多層感知器遵循人類神經系統原理,學習並進行資料預測。它首先學習,然後使用權重存儲資料,並使用算法來調整權重並減少訓練過程中的偏差,即實際值和預測值之間的誤差。

13

消失型梯度 vanishing gradient

是深度學習的一種現象,尤其在使用反向傳播演算法訓練深層神經網路時常可見到。在深層神經網路此種現象表現為在訓練過程中,隨著網路深度的增加,通過鏈式法則的連乘效應計算出的梯度在反向傳播到網路較淺的層時變得極其微小,甚至接近於零。故導致較淺層的參數更新幾乎停滯,遂引致深層網路難以學習的問題。影響整個網路的訓練效果。

14

激增梯度 exploding gradient

在深度學習訓練神經網路過程中,由於反向傳播演算法中梯度的連乘效應,導致深層網路參資料越來越大的問題。

此過程將使得梯度值變得非常大,導致參數更新過於劇烈,使得模型的權重發散,從而無法正常訓練。此種現象通常發生在深層網路中,尤其是反向傳播時,梯度的累積放大了原本的導資料,導致了梯度的指數級增長。

15

微調fine tuning

在遷移學習中,利用已有模型的參數作為初始值,對新任務採取更進一步的訓練。

16

單樣本學習One-Shot Learning

一種在只有一個或極少量樣本的情況下,學習識別新類別的機器學習方法。