2025年6月8日 星期日

人工智慧醫療器材術語初輯(四之二)

© All Rights reserved. 版權聲明

地、資料集術語

序號

名詞

定義與說明

1

資料 data

資訊的可再解釋的形式化表示,以適用於通訊、解釋或處理。醫療相關資料大致分為五類:

1.       醫療影像資料:如X光片、CT掃描、MRI圖像等,用於訓練和查證人工智慧演算法關於識別病變、輔助診斷等的能力。

2.       電子病歷資料:包含患者的病歷紀錄、檢查結果、治療記錄等,用於訓練人工智慧系統進行疾病預測、支持醫療診斷、個人化治療方案建議等。

3.       生理監測資料:如心率、血壓、血氧、呼吸率、血糖等即時或連續監測資料,用於開發智慧健康管理和疾病監督系統。

4.       基因組資料:用於藥物基因組學研究,幫助個人化醫療和精準治療方案的制定。

5.       臨床試驗資料:涉及新藥或醫療器材的臨床試驗資料,用於查證人工智慧輔助決策系統的準確性和安全性。

註:可以通過人工或自動化方式處理上述資料。

2

個人敏感(性)資料 personal sensitive data

一旦洩露、非法提供或濫用,可能危害人身和財產安全,極易導致個人名譽、身心健康受到損害或歧視性待遇等的個人資訊。

註:【個人敏感資訊personal sensitive information】包括:身份證件號碼、個人生物識別資訊、銀行帳號、通訊記錄和內容、財產資訊、徵信資訊、行蹤軌跡、住宿資訊、健康生理資訊、交易資訊、14歲以下(含)兒童的個人資訊等。

3

健康資料 health data

個人或群體健康相關的資訊,包括:身體狀況監測,疾病預防和健康趨勢分析的資料,使用在醫療診斷、治療、研究與管理。

1:如生物資料(基因等)、生理資料(如:血壓、脈搏)、環境資料(空氣)、心理狀態資料、社交資料以及就診資料。

2:世界各國制定不同的符合性法規,例如:歐洲需要採取的要求和參考事項係《個人資料》和《敏感資料》;美國的健康資料為《受保護的健康資料, PHD》,故需分別考慮當地區域或國家適用的法律或法規要求。

3:健康資料類型如:

l   結構化資料:如電子病歷(EHR)、實驗室檢查結果、生命徵象資料(如:心率、血壓等)。

l   非結構化資料:如醫師筆記、醫療影像,如:X光、CTMRI、及語音記錄。

l   即時資料:來自穿戴式設備(如:智慧手錶)的連續監測資料,如:心率變異性、血氧濃度。

l   基因與生物資料:基因序列、蛋白質資料,用於精準醫療。

l   行為與環境資料:如:生活方式(飲食、運動)、環境曝露資料,影響健康風險評估。

4:健康資料原則如:

隱私與安全:資料去識別化與加密傳輸,防止資料洩露

公平性與無偏見:避免資料偏見導致模型歧視,如:對特定族群的誤診。

透明性與可解釋性:決策過程需提供追溯性,醫療情境時,醫師與患者需理解模型輸出依據。

符合性:遵循國際與當地法規及標準。

4

缺失資料 missing data

按照研究方案要求收集但未觀測到的資料。

5

資料元(素) data element

用一組屬性規定其定義、標識、表示和允許值的資料單元。

構成醫療器材資料的基本單位。該等資料元素是醫療器材在運作過程中產生,預期使用在醫療用途的客觀資料,包括(但不限於)醫學影像器材獲取的醫學圖像/影像資料、醫用電子器材擷取的生理參數資料,以及體外診斷器材測出的體外診斷資料等。某些特殊情形,通用器材(非監督型器材)產生的用於醫療用途的客觀資料,亦屬於醫療器材資料元素的一部分。

例如:數位相機拍攝的患者局部皮膚照片,預期用於皮膚疾病診斷,或者健康照護電子產品採集的心臟電性資料,預期供醫療保健人員查看、評估及診斷潛在心臟或心血管疾病,及必要時,提出預防性警告。

6

元資料 metadata

定義和描述其他資料的資料。

描述人工智慧模型或系統本身及其相關資訊的資料。包括:模型的名稱、版本、連結到代號或編碼資料庫、許可證、相關論文、模型性能指標等。

註:元資料用於説明有助於使用者理解模型的特性,進行模型的檢索、對比和篩選、模型的訓練資料來源、架構細節、參數設置等,此等資訊對於模型開發、評估和應用皆甚重要。

7

資料品質 data quality

在指定條件下使用時,資料的特性滿足明確的和隱含的要求之程度。

8

資料集 data set

具有一定主題、可以標識並可以被計算機化處理,用於訓練、確證和測試機器學習模型的資料集合,通常包括輸入資料和對應的輸出標籤,該等資料對模型的學習過程至關重要。

資料集的品質直接影響模型的性能和泛化能力。在深度學習和機器學習領域,資料集的構建和處理是至關重要的步驟。

資料集可以是圖像、文本、音訊等多種類型,且可能需要經過預處理、清洗、增強等步驟以提高模型的準確性。

9

訓練集 training set

用於訓練人工智慧演算法的資料集,此等資料集包含了輸入特徵和對應的輸出標籤,模型通過學習這些資料來識別模式並生成預測能力。其外部知識源可用於演算法參數的計算。

在準備階段,訓練集帶有的資料集通常通過清洗、預處理和可能的資料增強,以確保模型學習到的資料是有價值的。訓練集的大小和品質直接影響到模型的訓練效果和最終的性能表現。訓練集的選擇對於模型的性能至關重要,因為模型會根據該等資料進行學習並調整其內部參數。理想情況下,訓練集應該能夠代表模型將在其中工作的資料分佈,以便模型能夠泛化到新的、未見過的資料上。

10

調優集 tuning set

在模型微調(Fine-tuning)過程中使用的資料集。用於優化人工智慧演算法的資料集,其外部知識源可用於演算法超參數的選擇。此種資料集用於在預訓練模型的基礎上進一步訓練,以適應特定任務或領域。

調優集包含特定於目標任務的示例,説明模型學習如何更好地執行特定功能,如:圖像品質調整、自然語言處理任務等。

11

基準資料集benchmark datasets

用於評估和比較不同演算法模型的性能之標準化資料集,提供公平地確證計算模型暨方法的評估基準。因其確保所有模型在相同的條件下進行測試,可供研究人員和開發者在不同的模型和方法之間進行直接比較。從而可以準確地衡量各種受到評估的模型間之優劣狀況。

12

測試集/確證集 testing set

validation set

用於測試人工智慧演算法性能的資料集,其外部知識源可用於對演算法的評估。

評估機器學習模型性能的資料劃分為三個主要部分,

一、訓練集:模型學習資料特徵和參數的集合並用於擬合模型。

二、確證集:在訓練過程中,查證集用於調整模型的超參數、選擇模型架構和進行早期停止等操作。它説明防止過擬合,確保模型在未見過的資料上也能表現良好。

三、測試集:一旦模型在訓練和調整參數後完成,測試集用於最終評估模型的泛化能力。這個集合作為一個獨立的、未參與訓練或查證的資料集,提供了一個對模型在實際應用中表現的無偏倚估計。

經由三步驟劃分方式,機器學習從業者可以確保模型不僅在訓練資料上表現良好,而且在新的、未見過的資料上也能保持良好性能。此種做法有助於提高模型的健壯性和可靠性。

13

資料生存週期 data life cycle

資料收集、獲取、準備、存儲、訓練、整合、分析、評估、應用、呈現、開展、監督、歸檔和銷毀等各種生存形態演變的過程。略述如下:

1.       資料收集:獲取用於訓練人工智慧模型的資料的過程。資料可以來自各種來源,包括感測器、資料庫、互聯網、社交媒體等。資料收集的範圍和品質直接影響到後續模型的性能。

2.       資料準備:資料需要經過清洗、預處理和格式化,以確保其品質並適配模型訓練需求。這可能包括資料增強、去噪、缺失值處理等步驟。

3.       資料標注:對於監督學習任務,資料需要被正確標注,以便模型能夠學習到資料的正確表示和模式。

4.       資料增強:通過生成或修改資料來增加訓練資料集的多樣性和量級,以提高模型的泛化能力。

5.       模型訓練:使用準備好的資料集來訓練人工智慧模型。這涉及選擇合適的演算法、調整超參數和進行多次反覆運算以優化模型性能。

6.       模型評估:通過確證集和測試集來評估模型的性能,確保其在未見過的資料上也能表現良好。

7.       模型優化:根據評估結果對模型進行調整和優化,包括微調、正則化、集成學習等方法。

8.       模型部署:將訓練好的模型部署到生產環境,使其能夠處理實際的輸入資料並輸出預測結果。

9.       模型監督:持續監督模型在生產環境中的表現,包括性能監督、資料品質監督和模型更新監督,以確保其持續有效。

14

資料集偏差 dataset bias

資料集偏離預設目標的一種系統性偏差。該種偏差可能源於資料收集、處理或使用過程中的某些因素。偏差可能表現為資料樣本的非代表性、資料分佈的不均衡或資料處理方法的偏向性。

資料集中的某些特徵、雜訊或分佈特性被模型學習到,該等特性可能在更廣泛的資料分佈中不具有代表性。從而導致模型在多樣化的或未知的資料上表現不佳,產生不公平或有偏見的結果。資料集偏差可能來源於選擇偏差、採集偏差、負樣本偏差等。選擇偏差是指在構建資料集時,資料獲取者有意識地選擇特定樣本,導致資料集不能代表真實世界的總體分佈。採集偏差是由於資料獲取方法或環境因素導致的資料樣本偏向特定類型。

負樣本偏差則指資料集中負樣本的選擇無法代表真實世界的「非目標」分佈情況。

資料集偏差的根源包括現有資料集的侷限性,以及人類報告和選擇偏差、演算法偏差和解釋偏差。資料集偏差會導致模型在跨資料集測試時性能下降,影響模型的泛化能力、公平性和可解釋性。

研究者通過設計抵抗偏差的演算法,試圖提升模型性能,設想的理想情況,既可以識別和控制資料集偏差,以便訓練出既能利用資料中的有用資訊,又能抵抗負作用偏差影響的模型,仍然是嚴峻的挑戰。

15

資料品質特徵 data quality characteristic

 

對資料品質有影響的資料品質屬性的類別。

資料品質是人工智慧系統效能的核心基礎,劣質資料會導致模型偏差(Bias)、低準確度甚至決策錯誤。

資料品質關鍵特性如:準確性、完整性、一致性、時效性、相關性及可解釋性。

16

資料階層 data stratification

 

從不同粗細細微性表徵資料特徵的資料階層結構。將資料集按照特定準則劃分成不同的層次或類別,以便於管理和分析。此種分層通常基於資料的特徵、品質、來源或時間等屬性。

註:一般包含以下層級:

l   資料元素

l   記錄(匯集資料元素)

l   資料集(匯集記錄)

l   多資料集(匯集資料集)

17

參考標準 reference standard

篩查、診斷和治療過程或基於標注過程建立的基準。

註:參考標準可包含疾病、生理狀態或生理異常,以及位置和程度等資訊標籤。

18

金標準 gold standard

篩查、臨床診斷和治療可依據的最佳參考標準。

19

GT ground truth

用於和演算法標准確證的參考標準。

註:亦稱《真值》。

20

資料清洗 data cleaning

檢測和修正資料集合中錯誤資料項目的預處理過程。

21

資料治理 data governance

資料資源及其應用過程中相關管控活動、績效和風險管理的集合。

22

資料採擷 data mining

對於定量資料,通過從不同視角和維度分析、分類並總結潛在的聯繫和影響,以此提取模式的計算過程。

23

資料標籤 data label

附加到一組資料元素的識別字。

 

24

資料獲取 data acquisition

資料由生成裝置按照資料獲取規範生成,以數位化格式存儲並傳輸到目標系統的過程。

25

資料脫敏 data masking

通過去標識化或匿名化,實現對個人敏感資訊的可靠保護。

26

匿名化 anonymization

通過對個人資訊的技術處理,使得個人資訊主體無法被識別或者關聯,且處理後的資訊不能被復原的過程。

27

去標識化de-identificaiton

通過對個人資料的技術處理,使其在不借助額外資訊的情況下,無法識別或者關聯個人資訊主體的過程。

註:去標識化建立在個體基礎上,保留了個體顆細微性,採用假名、加密、雜湊函數等技術手段,替代對個人資訊的標識。

28

資料標注 data annotation

對資料進行分析,添加外部知識的過程。

註:參見GB/T 42755-2023人工智慧—面向機器學習的資料標注規程

1.       資料標注流程框架:分為三個階段的流程框架:初期計畫、中期執行、結果核查和輸出。包括如何定義資料需求、確定標注說明規則、選擇合適的標注工具和平臺等。

2.       標注任務前期準備:資料需求方和標注管理方需要明確標注任務,包括內容和資料的確定。標注管理方還負責評估標注任務的可行性,並可能根據標注人員的要求調整任務。

3.       標注工具和場景選擇:選擇適合標注任務的工具和場景是前期準備的重要部分,確保標注過程高效且符合特定需求。

4.       標注任務執行:執行階段要求資料需求方、標注管理方及資料標注方遵循標注流程的程序控制,完成創建、分發、開展及回收標注任務。此階段強調品質控制,確保標注任務的準確性。

5.       標注結果輸出:標注後的資料需要經過內部品品質檢查查,確保符合預期標準後交付給資料需求方。若標注結果不符合預期,則需進行修正並重新品質檢查。

6.       人工智慧醫療器材註冊審查指導原則:該指導原則不僅涵蓋人工智慧醫療器材的註冊申報,並涉及生命週期過程管理。強調在資料標注過程中宜遵循的規範,以滿足技術審查要求。

7.       品質管制機制:包括多人交叉查證、專家審查等多層次的品質管制措施,確保標注資料的可靠性。

8.       特定領域的標注準則:如醫療影像標注,需要考慮醫療影像的特殊性,包括區域標注和分類標注,以輔助臨床診斷。

9.       資料標準化處理:對於不同醫院和設備的多樣化資料格式,建立統一的資料標準化流程,確保資料的一致性和可用性。

29

仲裁arbitration

多名標注人員對同一原始資料的標注結果不一致時,用於決定最終結果的過程。

30

仲裁方式arbitration method

 

在標注人員對原始資料的標注結果不一致時用於決定最終結果的方式。

註:如少數服從多數方式以及仲裁人員個人決定方式。

31

圖像image

物體通過成像原理而重顯的影像,並可數字化。

註:圖像一般以多維坐標系統圖元點的位置,對應實體點在空間中的位置,以圖元點的圖元值(或顏色)對應實體點的性質,如放射影像、分子影像、熱影像、顯微圖像等。

32

圖形graphics

用來表示一個變數相對於其他變數變化情況的線條圖,或用以代替文字說明一個概念和思想的圖解和表格。

33

文本text

 

以字元、符號、字、短語、段落、句子、表格或者其他字元排列形式出現的資料,旨在表達一個意義,其解釋主要以讀者對某種自然語言或人工語言的瞭解為基礎。

34

資料 numerical value

量化的資料或分類,用來表示水準或狀態。

35

音訊audio

一種數位化動態媒體形態,用於描述聲音及其時序性質,並可進行數位人工合成。

36

視頻video

一種數位化動態媒體形態,用於描述運動圖像,進行高速資訊傳送或顯示瞬間的相互關係。

37

多媒體 multimedia

綜合表現文本、圖形、圖像、音訊和視頻的資訊組合。

38

輪廓係數Silhouette Coefficient

用於評估聚類性能的指標,尤其適用於無監督學習中的聚類分析。輪廓係數的取值範圍為[-1, 1],衡量每個樣本點與其所屬簇的相似度與其與最近鄰簇的相似度之間的差異。

l   當輪廓係數接近於1時,表明樣本點與簇內其他點的相似度高,與最近的其他簇相似度低,聚類效果好。

l   當輪廓係數接近於-1時,表明樣本點與簇內其他點的相似度低,與最近的其他簇相似度高,聚類效果差。

l   當輪廓係數在0附近時,表示樣本點處於兩個簇的邊界,難以確定其歸屬。

品質特性術語

序號

名詞

定義與說明

1

軟體品質 software quality

在規定條件下使用時,軟體產品滿足明確或隱含要求的能力。

2

軟體品質保證 software quality assurance

為使某專案或產品遵循已建立的技術需求,提供足夠的置信度,而必須採取的有計劃的和有系統的全部活動的模式。

設計以估算產品開發或製造過程的一組活動。

3

性能 performance

系統或部件在給定的約束條件下,實現指定功能的程度。

4

性能評估 performance evaluation

為確定運行目標達到何種有效程度,而對系統或系統部件的技術評估。

5

可靠性 reliability

在規定時間間隔內和規定的條件下,發生故障的概率,即系統或部件能持續穩定地執行預期功能的能力。此中涵蓋系統或部件的耐用性和壽命,及面對各種使用條件和環境變化時保持性能的能力。

為了提高可靠性,製造商需在設計階段考慮各種潛在的危害狀況及失效模式,並通過符合性測試和查證,確保醫療器材在實際應用中達到預期使用時的安全與性能。此外,定期維護和更新也是保持醫療器材可靠性的重要措施。

6

完整性 integrity

 

(a)保護資產準確性和完備性的性質。

(b)資料創建、傳輸或存儲未經授權不得更改的屬性。

從軟體與資料安全面向考量演算法的安全性、有效性、以及在臨床應用中的可靠性。例如:

1.       演算法的安全和有效:人工智慧醫療器材的演算法需要經過嚴格確證,確保其在臨床應用中能夠準確、可靠地輔助決策。這包括對演算法性能的評價,特別是資料品質與演算法泛化能力的考察,以避免因資料偏倚導致的決策失誤。

2.       資料集通用要求:人工智慧醫療器材的訓練和測試依賴於高品質的資料集。確保資料的多樣性和代表性,以提高演算法的泛化能力和臨床應用的可靠性。

3.       術語和定義:採用人工智慧醫療器材相關標準,產業界得以一致性的術語和定義展開。

4.       風險管理:人工智慧醫療器材的開發和使用過程,須考慮潛在的風險,包括:資料隱私、演算法偏倚等,通過有效的風險管理措施確保產品的安全性和有效性。

5.       監督和審查:遵循主管機關人工智慧醫療器材的審查要求及指引文件,確保產品符合醫療器材安全和有效。

6.       倫理審查:人工智慧醫療器材的倫理審查關注演算法的公平性、透明度和可解釋性,確保技術應用不會造成社會倫理問題。

7.       標準規範:隨著人工智慧技術在醫療領域的廣泛應用,國際上如IMDRFITU/WHO等機構,及各區域或國家的人工智慧醫療器材標準化技術負責機構,都在推動相關標準的建立,以規範產業發展,提升產品的品質和安全。

7

一致性 consistency

 

(a)  在資料集的各階段、文件、系統或系統部件的各部分之間,一致、標準化、無矛盾的程度。

(b)  在使用人工智慧技術處理醫療資料時,確保資料的準確性和連貫性。

(c)   (資料)一致性要求系統能夠可靠地處理來自不同來源、不同格式的資料,並確保這些資料在系統內部保持一致,以支援準確的分析和決策。例如:在醫學影像分析中,(資料)一致性確保不同時間點、不同器材採集的影像資料能夠統一地轉化成標準格式供資料處理,以便人工智慧系統能夠準確識別和分析病變。此外,(資料)一致性還要求在資料更新和同步過程中,確保所有相關的醫療記錄和分析結果都能及時、準確地反映最新的醫療狀態。

8

重複性Repeatability

由同一操作員按相同的方法、使用相同的測試或測量設施、在短時間間隔內對同一測試/測量對象進行測試/測量,所獲得的獨立測試/測量結果間的一致程度和穩定性。

9

再現性 reproducibility

 

由不同的操作員按相同的方法,使用不同的測試或測量設施,對同一測試/測量物件進行觀測以獲得獨立測試/測量結果,所獲得的獨立測試/測量結果間的一致程度。

(資料)再現性是評估人工智慧醫療軟體性能和可信度的關鍵指標之一,在資料獲取、處理和演算法運行過程中各個環節都具備高度可控制和一致性。不僅包括硬體和軟體環境的一致性,亦及資料標注和演算法訓練過程的標準化。(資料)再現性是確保人工智慧醫療器材在臨床應用中安全有效的重要因素。

10

可達性 accessibility

組成軟體的各部分便於選擇使用或維護的程度。

註:考量因素(非完整列出)

l   資料來源可能是醫療保健機構、學術研究單位、患者臨床資料、醫療保險機構等;

l   資料品質涉及準確、完整性及時效;

l   資料多樣性涉及不同醫療機構與保健單位提供資料來源、各種臨床情境;

l   法規要求:如資料保護法、個人資訊保護;

l   獲取途徑:如學術機構、公開資料庫、特定醫療分享平臺;

l   可追溯性:資料來源可追蹤以供法規審查;

l   非封閉性資料:資料品質管制、隱私保護、演算法性能測試、後市場監督。

11

可得性 availability

(軟體)可得性

a)軟體(系統或部件)在投入使用時可操作或可訪問的程度、能獲得並使用、或能實現其制定系統功能的概率;

b)系統正常工作時間和總的執行時間之比;

c)在運行時,某一配置項實現指定功能的能力。

(資料)可得性

需明確說明使用或生成的資料之獲取方式和途徑。如:

l   從開放或公共儲存庫取得者、

l   因倫理、法律或商業原因未能公布來源者、

l   資料不對外公開者。

12

保密性 confidentiality

資料對未得到授權的個人、實體或過程不可用或不洩露的特性。

保密性涉及資料安全和隱私保護。隨著醫療資料的大量積累和人工智慧技術的應用,如何確保該等敏感性資料的保密性係關鍵考量。包括保護患者個人健康資訊不被未經授權的協力廠商訪問或洩露。人工智慧系統在處理醫療資料時,需要遵循嚴格的隱私保護法規,如《健康保險可攜性和責任法案》(HIPAA)在美國的規定。為實現保密性,人工智慧醫療器材通常採用加密技術、存取控制措施和安全協定,確保資料在傳輸和存儲過程中的安全。此外,透明度和倫理準則亦係確保資料保密性的要項,人工智慧系統的設計和應用必須符合倫理和法律標準,防止資料遭到濫用。

13

網路安全cybersecurity

通過採取必要措施,防範對資料、模型等攻擊、侵入、干擾、破壞及非法使用,以及意外事故,使器材處於穩定可靠運作的狀態,以及保障資料、模型等的完整性、保密性、可得性的能力。

主要考慮面向:資料保護、系統防護、訪問控制、更新與維護、應急響應、符合性、保護隱私、供應鏈安全、監督與稽核、使用者訓練等。

網路安全應貫穿器材整個生命週期,從設計開發到上市後監督,皆須採取措施管理安全風險。包括進行安全風險評估、實施安全控制措施、以及從開發階段融入安全設計。器材製造商需提供使用者必要資訊,以增強網路安全透明度。建議使用安全產品開發架構(SPDF)以開發使用者,並滿足相關的品質管理系統要求。

14

安全性 safety

免除於不可接受的風險。

意指在設計、開發、生產、使用和維護過程中確保器材不會對患者、操作人員或周圍環境造成傷害。涵蓋範圍如:技術安全、資料安全、功能安全等。技術安全涉及演算法的健壯性、可解釋性以及對抗樣本的防禦能力,確保人工智慧系統的決策和行為符合預期且可理解。

15

健壯性 robustness

註:亦稱《魯棒性》、《強固性》。

存在於無效輸入或急迫的環境條件下,系統或部件之功能正確的程度。

人工智慧系統在面對輸入資料的噪音、對抗攻擊、分佈偏移或異常情境時,仍能維持穩定且可靠輸出的能力。其核心目標是確保模型在「非理想條件」下的泛化性與安全性,避免因微小干擾導致重大錯誤。

健壯性的關鍵面向係為輸入穩定性、分佈外泛化及系統容錯程度,須考量對抗健壯性的微小擾動、處理自然噪音或雜訊、訓練資料未涵蓋狀況時的正常運作能力等。

16

泛化能力 generalizability

機器學習演算法對陌生樣本的適應能力。意指人工智慧工具在不同環境、資料集和臨床條件下的適用性和一致性。通常考慮下列面向:資料品質與多樣性、性能標準化評估、變更管理與上市後監督、自適應學習能力的限制、應用領域、性能測試方法、法規與標準等。

17

回應時間response time

在給定的測試環境下,對給定個數量樣本進行運算,並獲得結果所,需要的平均時間。

18

可追溯性 traceability

(a)    系統對其決策過程及結果進行記錄的特性。

(b)    人工智慧醫療器材的設計與開發過程、生產過程、經銷、使用過程及更新過程能夠追蹤與記錄的能力。

1:可追溯性矩陣 (traceability matrix) 係記錄兩或多個任務之間關係的矩陣。

2:可追溯性要求項目如:演算法性能評估、資料管理、變更管理、自適應學習能力、監督與符合性。

19

公平性 fairness

系統做出不涉及喜好和偏袒決策的性質。

意指在人工智慧輔助決策或診斷過程中,確保演算法和系統對所有使用者群體公平對待,避免基於性別、年齡、種族等因素的歧視。其中涉及資料集的多樣性和演算法的訓練方式,確保人工智慧系統做出決策時不會無意間放大或引入偏見。

20

可解釋性 explainability

(人工智慧)模型或演算法能夠以人類可以理解的方式,解釋其決策過程的能力。

以人能理解的方式,對人工智慧系統決策因素進行說明的能力。

1:可解釋性並非單純的技術問題,而是與演算法治理、演算法安全密切相關的複雜問題。

2:可解釋性有助於建立信任,減少模型的黑盒子特性,並在出現錯誤時能追溯原因。

沒有留言: