© All Rights reserved. 版權聲明。
天、基礎技術術語 |
||
序號 |
名詞 |
定義與說明 |
天1 |
人工智慧 artificial intelligence, AI |
表現出與人類智慧(如推理和學習)相關的各種功能的功能單元的能力。 |
天2 |
人工智慧醫療器材 artificial intelligence medical device |
整合人工智慧或機器學習技術實現預期用途的醫療器材,能夠透過資料分析、模式識別或自主決策,輔助或執行醫療診斷、治療、監測或健康管理等功能。通常具有下列特徵: l 基於演算法:依賴人工智慧/機器學習模型進行資料處理與決策。 l 醫療用途:用於疾病診斷、預後評估、治療建議等醫療行為。 l 動態學習能力(部分系統):可透過新資料持續優化模型(如適應性人工智慧)。 運作架構包括下列層級: l 資料輸入層:醫學影像(X光、MRI)、生理訊號(ECG)、電子病歷(EHR)、穿戴裝置資料等。 l 人工智慧演算法層:深度學習(CNN、RNN)、機器學習(SVM、決策樹)、自然語言處理(NLP)等。 l 決策輸出層:診斷建議(如肺癌偵測)、風險分層(如敗血症預警)、治療規劃(如放射劑量優化)。 l 人機協同合作介面:臨床決策支援系統(CDSS)、醫師覆核機制、可解釋性人工智慧(XAI)提供決策依據。 預期使用情境分類: l 診斷型人工智慧(高風險):如人工智慧輔助病理切片分析(FDA批准的Paige Prostate)。 l 治療型人工智慧:如手術機器人達文西系統中的影像導引人工智慧。 l 監測型人工智慧(中低風險):如穿戴裝置的心房顫動(AFib)偵測功能。 l 健康管理型:如糖尿病管理App(Diabeloop)。 註1:如採用機器學習、神經網路、深度學習、聯邦學習等技術實現輔助診斷等功能的醫療器材軟體。 註2:如以人工智慧技術從源頭賦能醫療器材,形成內嵌人工智慧演算法、或基於人工智慧晶片形成的智慧硬體設備。 |
天3 |
醫療器材軟體 software as a medical device (SaMD) |
醫療器材軟體通常包括《軟體元件》和《獨立軟體》,《軟體元件》是指嵌入到醫療器材中或作為醫療器材組成部分的軟體,《獨立軟體》是指預期用於一個或多個醫療目的,無需作為醫療器材硬體組成部分即可完成預期用途的軟體。 註:《獨立軟體》可能包括具有醫療目的之軟體,可以是獨立運行於通用計算平臺的《獨立軟體》,或者是控制或驅動醫療器材硬體的《軟體元件》。此等軟體可能需要滿足特定的安全和電磁相容性標準,在系統軟體、應用軟體、中介軟體和支援軟體的範疇內,醫療器材軟體屬於應用軟體,通常依賴於系統軟體運行,並可能需要其他軟體的支援。 |
天4 |
模式識別 pattern recognition |
通過功能單元對某一物件物理或抽象的模式以及結構和配置的辨別。主要關注從大量資料中自動提取資訊,並將資料分類為預定義的類別。模式識別在電腦視覺、語音辨識、自然語言處理等領域有著廣泛的應用。 模式識別的基本步驟包括: l 資料收集:從各種來源收集資料。 l 預處理:對資料進行清洗和格式化,以提高識別的準確性。 l 特徵提取:從資料中提取能夠代表模式的特徵。 l 模式分類:使用機器學習演算法對提取的特徵進行分類。 l 後處理:對分類結果進行進一步的分析或調整。 模式識別的關鍵技術包括: l 機器學習:通過訓練資料來學習模式的統計規律。 l 深度學習:利用多層神經網路來自動提取複雜的特徵。 l 特徵提取與分類演算法:如支援向量機、決策樹、神經網路等。 l 影像處理:如目標檢測、圖像分割、3D重建等。 l 自然語言處理:如文本挖掘、語音辨識。 |
天5 |
神經網路 neural network |
由加權鏈路且權值可調整連接的基本處理元素的網路,通過把非線性函數作用到其輸入值使每個單元產生一個值,並把它傳送給其他單元或把它表示成輸出值。 註:此種計算模型旨在通過演算法,類比人腦處理資訊的方式。由多個互相連接的節點或神經元組成,該等節點通過可調的權重連接,接收輸入資料並產生輸出。 |
天6 |
深度神經網路Deep Neural Network, DNN |
(a)
一種由多個神經網路層構成的深層次結構,用於學習高層次的特徵表示和模式識別。 (b)
一種模仿生物神經系統結構的機器學習模型,相互連接的人工神經元(節點)組成,能夠通過非線性轉換從資料中自動提取高階特徵,並用於分類、回歸、生成等任務。 通常具有下列特徵: l 層次化架構:包含輸入層、隱藏層(≥1層)、輸出層,層數越多則「深度」越深。 l 非線性激活函數:如ReLU、Sigmoid,使模型能擬合複雜函數。 l 端到端學習:直接從原始資料(如像素、文字)學習特徵,無需人工特徵工程。 運作架構包括下列層級: l 輸入層:接收原始資料(如影像、語音),維度與資料特徵對應(如224×224像素)。 l 隱藏層:通過權重矩陣(Weights)與激活函數逐層提取特徵(如邊緣→紋理→物體部件)。 l 輸出層:生成最終結果(如分類概率、回歸值)。 註:深度學習是神經網路的一個重要延伸,它通過多層神經元的堆疊來實現複雜的模式識別和決策。 |
天7 |
推理 inference |
從已知前提匯出結論的方法。 註1:在人工智慧領域中,《前提》是事實或規則。 註2:術語《推理》既指過程也指結果。 註3:人工智慧領域裡,《推理》是模型應用已學習的資訊做出預測或決策的過程。在機器學習和深度學習中至關重要,尤其是在模型的部署和實際應用階段。《推理》不同於訓練階段,《訓練》旨在通過大量資料調整模型參數以最小化誤差,《推理》則是在新的、未見過的資料上應用模型來獲得預測結果。推理過程直接關係到模型在現實世界中的表現和效用。 |
天8 |
特性 features |
能表達模式本質的功能或結構特點的可度量屬性,如大小、紋理、形狀等。好的特性應能使同類模式聚類、不同類模式分離。 註1:特性是資料的基本組成單元,用於説明演算法理解輸入資料並從中學習。特性可以是資料型的,也可以是類別型的,如:房屋的面積、位置、價格等。在訓練模型時,選擇合適的特性對於模型的性能至關重要。 註2:特性工程作業是個重要的過程,包括:特性選擇、特性提取和特性轉換等,旨在提高模型的預測能力。人工智慧演算法通過學習這些特性以識別模式和規律,從而做出預測或決策。 註3:在圖像識別任務中,特性可以是:顏色、紋理、形狀等;在自然語言處理中,特性可以是:詞頻、詞性、句法結構等。特性的重要性在於將會直接影響模型的訓練效果,因此在應用人工智慧技術時,合理的特性選擇和工程作業過程步驟必不可少。 |
天9 |
機器學習 machine learning |
功能單元通過獲取新知識或技能,或通過整理已有的知識或技能來改進性能的過程。 註:讓電腦能夠從資料中學習並做出預測的一種技術,專注於開發演算法,使電腦能通過經驗自動改善績效。機器學習的主要過程包括:明確任務目標、收集資料、標注資料、訓練模型、測試模型和應用模型。在訓練過程中,機器學習演算法會分析資料,找出其中的模式和規律,從而構建出能夠完成特定任務的模型。該等模型可以用於分類、迴歸、聚類等多種任務。 |
天10 |
深度學習 deep learning |
通過訓練具有多個隱層的神經網路來獲得輸入輸出間映射關係的機器學習方法。 註1:使用多層神經網路來類比人腦的複雜結構和功能。此種技術能夠從大量資料中自動提取特徵,進行高級抽象化作業,從而實現對複雜模式的理解和決策。 註2:深度學習的原理基於神經網路,是一種由許多簡單處理單元(稱為神經元)組成的系統,此等神經元通過連接進行交互作用。 註3:深度學習模型通常包含多個層級,每一層級都負責從資料中學習不同的特徵。通過逐層級傳遞和學習,深度學習演算法能夠識別圖像、聲音、文本等不同形式的資料中的模式。 註4:能夠處理大規模的非結構化資料,並通過大規模資料集進行訓練來提高準確性和效率。此外,深度學習模型的端到端學習能力使其在沒有大量人類參與特徵辨識的情況下也能表現良好。 註5:此方法的侷限性在於缺乏可解釋性,即難以理解模型為什麼做出某些決策。此外,其需要大量的計算資源和資料進行訓練,故限制在某些情境中的應用。 |
天11 |
監督學習 supervised learning |
一種學習方法,為了查對獲得知識的正確性,係通過來自外部知識源的回饋,並加以測試的學習方法。 註1:亦稱《監督式學習》。 註2:此種學習方法利用標記資料,如分類和迴歸等任務。 註3:通過從標記資料集中學習來建立一個模型或函數,該模型可用於預測新實例的輸出。監督學習演算法接收輸入資料(特徵)和對應的輸出標籤,通過訓練過程調整模型參數,使其能夠準確地映射輸入到輸出。此種方法適用於兩種任務: l 分類:將輸入資料分類到預定義的類別中,如:垃圾郵件過濾、情感分析等。此種模型學習如何區分不同類別的特徵,通常輸出方式為類別標籤。 l 迴歸:預測連續資料,如:房價預測、股票走勢等。此種模型學習輸入與輸出之間的某種函數關係,目標是減少預測值與實際值之間的誤差。 註4:監督學習的關鍵在於訓練資料集的準備過程,即需要大量帶有正確標籤的樣本。訓練過程中,演算法會嘗試最小化《損失函數》,確保模型在訓練集上的表現盡可能接近真實值。完成訓練後,預期該模型可用來對未曾嘗試或面對過的資料進行預測。監督學習的成功依賴於資料的品質和多樣性,以及內部挑選與設定模型的選擇和優化調適。 |
天12 |
無監督學習 unsupervised learning |
一種學習策略,觀察並分析不同實體以及確定某些子集能分組到特定類別,無需在獲得的知識上通過來自外部知識源的回饋,以實現任何正確性測試。此種學習法的目標: l 發現隱藏結構:識別資料中的聚類、降維表示、異常或關聯規則。 l 資料壓縮與可視覺化:通過降維以簡化資料,便於人類理解。 l 生成新資料:學習資料分佈以生成類似的新樣本,如:生成對抗網路GAN的無監督部分。 註1:此種方法特點是不要求以人工標注方式添加標籤,演算法直接從輸入資料探索潛在的模式、結構或分佈狀況,一旦形成概念,就賦予名稱,該名稱即可使用在其他概念的後續學習。此項學習過程旨在發現資料中隱藏的規律,而非從訓練資料庫擷取既存結果而輸出預測事項。 註2:亦稱《無師式學習》。 註3:此種方法價值在於挖掘資料的隱含、未明示或內在的知識點,尤其在人工標注成本偏高的領域(如:醫療保健、天文學),此種學習方法具有不可替代的學習作用。 註4:此種學習方法弱點如: l 評估困難:從多方面擷取而來的資料往往缺乏標籤,難以量化模型性能,需依賴輪廓係數、肘部法則等間接型指標。 l 維度災難:高維度資料中距離計算失效或出現故障、需降低維度、導入查核、或補強計算方法。 l 先驗知識依賴:如聚類需預設簇數量,如K-Means中的K值,以避免因為個別簇的樣本數偏低,而出現整體簇數量無限制增大的情況。 l 局部最優解:演算法可能陷入次優化狀態,如EM演算法,未必能跳脫局部陷阱,探索能夠涵蓋整體範圍的通用解答。 |
天13 |
強化學習 reinforcement learning |
一種學習策略,它強調從環境狀態到動作映射的過程,目標是使動作從環境中獲得的累積獎賞值最大。 |
天14 |
半監督學習 semi-supervised learning |
一種學習策略,它自行利用少量的具有標記資訊的樣本和大量沒有標記的樣本進行學習的框架。 |
天15 |
自監督學習:self-supervised learning |
一種學習策略,通過基於資料本身設計和建立的各種標記資訊來對資料本身的特徵、特性進行學習,進而把學習到的資料特徵網路作為骨幹絡遷移到對目標任務的學習中。 |
天16 |
弱監督學習 weakly supervised learning |
一種學習策略,通過使用有雜訊的、不完全的、不精確的外部資訊源進行機器學習。 註:該方法減少了對標注資料品質和數量的要求。 |
天17 |
集成學習 ensemble learning |
通過結合多個學習器來處理問題的一種機器學習方式。 註:其常見形式是利用一個基礎學習演算法從訓練集產生多個基礎學習器,然後通過加權平均或投票等機制將基礎學習器進行結合,以提高模型性能的機器學習方式。 |
天18 |
主動學習 active learning |
學習過程中由學習器挑選未標記樣本,並請求外界提供標記資訊,旨在使用盡可能少的查詢以取得好的學習績效。 |
天19 |
遷移學習 transfer learning |
利用一個學習領域A上有關學習問題T(A)的知識,改進學習領域B上相關學習問題T(B)的學習演算法的性能。可以節省模型訓練時間和資料集大小。 |
天20 |
聯邦學習 federated machine learning |
一種從多個資料來源協同建立模型的機器學習框架,本地資料訪問受限,各個資料來源方獨立進行本地資料處理,通過交換資料模型,共同建立其學習模型,並將輸出結果回饋給用戶。 |
天21 |
訓練 training |
基於機器學習演算法,利用訓練資料,建立或改進機器學習模型參數的過程。 |
天22 |
反訓練 |
一種添加對抗性訓練模型,主要為了增強模型的健壯性,在面臨對抗樣本時表現更佳。對抗訓練通過生成器產生虛假資料來欺騙判別器,或通過在模型輸入中添加微小擾動來模擬潛在的攻擊,迫使模型在受到此種擾動時仍能做出正確的預測。此法可以提高模型對抗能力。 註:通常採用的反訓練技術如:快速梯度符號法(Fast Gradient Sign
Method)、快速梯度法(Fast Gradient Method)、投影梯度下降法(Projected Gradient
Descent)、整合型對抗訓練、防禦蒸餾、資料增強與對抗訓練結合等方法。 |
天23 |
聚類clustering |
旨在將相似的資料點分組。經典的演算法如: l K-Means:通過反覆運算將資料劃分為K個球形簇。 l 層次聚類:通過樹狀圖(Dendrogram)形成嵌套的簇結構。 l DBSCAN:基於密度劃分簇,可識別雜訊點。 l 高斯混合模型(GMM):假設資料由多個高斯分佈混合生成。 |
天24 |
降维dimensionality reduction |
旨在減少特徵數量,保留關鍵資訊。經典的演算法如: l 主成分分析(PCA):通過線性變換找到方差最大的正交方向。 l t-SNE:非線性降維,適合高維度資料可視覺化。 l 自編碼器(Autoencoder):神經網路通過編碼—解碼學習緊湊表示。 |
天25 |
交叉確證cross validation |
一種利用已知資料集獲取學習器最優參數,以期望在未知資料集上獲得最佳泛化性能。該法將資料集多次劃分為訓練集和確證集,通過輪換確證資料計算性能指標的平均值,削弱單次劃分的隨機性影響。尤其在資料量有限或範圍受到限制時,能有效避免過擬合和欠擬合問題。該方法的目標: l 評估模型性能:更準確地估計模型在未知資料上的表現。 l 優化超參數:輔助選擇最佳模型參數,如:正則化係數、樹深度等。 l 避免資料劃分偏差:減少因訓練集/測試集隨機劃分導致的評估波動。 註1:常見的有留出法(Hold-out validation)、留一法(Leave-one-out, LOO)、K重交叉確證(K-Fold
CV)、和時間序列交叉確證(Time
Series CV)法等。 註2:該方法的重要注意事項: l 資料分佈一致性:確保訓練集與測試集分佈相同,如:分類任務的類別平衡。 l
資料洩露(Data Leakage)疑慮: n 預處理(如歸一化)應在交叉查證的每一輪內獨立進行,避免使用全域統計量。 n 時間序列中需嚴格隔離未來資料。 l 性能指標選擇:分類(F1、AUC)、迴歸(MSE、R²)、聚類(輪廓係數)等需與係稱任務相匹配。 l 計算效率:K越大,耗時越長,如:LOO複雜度為O(N)。 |
天26 |
過擬合 overfitting |
學習器對訓練樣本過度學習,導致訓練樣本中不具有普遍性的模式被學習器當作一般規律,降低了泛化性能;突顯出性質是模型過度捕捉訓練資料中的雜訊或特定模式,即模型複雜度高於問題真實規律,而非學習通用規律。典型表現是訓練集上的性能越高,測試集上的性能越低。 註1:觀察過擬合的負面特點,如: l 訓練誤差極低,測試誤差高,如:通用化能力不足。 l 模型參資料異常大,如:權重過度快速增加。 l 對微小資料變化敏感,如:輸入輕微擾動導致輸出劇烈波動。 註2:過擬合的原因: l 資料量限制:訓練樣本數量少被模型全部記住,資料中存在大量無關特性或錯誤標注,訓練情境與實際情境差異大; l 模型限制:模型太複雜,神經網路層級多,神經元多、決策樹分枝多、徹底分類每個訓練樣本、特性維度多且贅餘、特性與目標關聯性低; l 訓練過程限制:迭化次數多、訓練時間過長、梯度下降未及時停止、最小化訓練誤差、忽略模型簡略情況。 |
天27 |
欠擬合 underfitting |
模型複雜度低於資料真實規律,無法有效學習特徵與目標之間的關係、模型過於簡單或訓練不足、學習器對訓練樣本學習不充分,皆可以導致訓練樣本中包含的重要模式沒有被學習器獲取,降低了通用化性能;一方面是訓練集和測試集上表現均不佳的現象。另一方面的表現則是如果訓練集的性能繼續提高,測試集的性能同時亦會提高。 註1:模型複雜度過低,如: l 線性模型擬合非線性關係,如:用線性回歸擬合正弦函數。 l 神經網路層數/神經元過少,如:單層感知機解決複雜分類。 l 決策樹深度限制過嚴。 l 使用原始特性而未構造更高階的特性。 l 特性工程作業的缺失,如:文本尚未向量化。 註2:模型的訓練過程不足,如: l 梯度下降未收斂即予停止。 l 學習率設置過低,如:參數更新緩慢 註3:資料量限制: l 特性與目標無關:輸入特性缺乏預測性,如:用身高預測股票價格。 l 資料雜訊過大:雜訊掩蓋真實規律,模型難以學習。 |
天28 |
前饋網路 forward-propagation network |
在給定層內的各人工神經元之間既沒有回饋路徑也沒有任何路徑的多層網路。 註:亦稱《前向傳播網路》、《非循環網路》。 |
天29 |
反向傳播網路 back-propagation network |
一種多層網路,它使用反向傳播,以便學習期間的連接權調整。 註:亦稱《回饋網路》。 |
天30 |
前饋傳播 feedforward propagation |
(a)
在多層網路中,從輸入層朝向網路的輸出逐層進行連接權調整的傳播。 (b)
資料從前向後通過神經網路的各層,每一層的神經元根據輸入資料和權重進行計算並產生輸出,最終生成模型的預測結果。此過程是模型進行推理和判斷的基礎。 註:亦稱《前向傳播》、《正向傳播》。 |
天31 |
回饋傳播feedback propagation |
(a)
在多層網路中,從連接權調整輸出層朝向網路的輸入的逐層傳播。 (b)
系統首先計算輸出層的誤差,然後通過鏈式法則將誤差反向傳播至前幾層,根據誤差梯度來更新權重。此種過程使得模型能夠根據實際輸出與期望輸出之間的差異進行學習,逐漸優化參數,以提高預測的準確性。 註:亦稱《反向傳播
backpropagation》 |
天32 |
醫學知識庫 medical knowledgebase |
幫助臨床科研人員、臨床醫務人員等,快速、便捷地獲取疾病診斷、治療、用藥等全面、系統、動態的臨床醫學知識的集合,也可作為臨床教學及臨床診療的輔助參考工具。 |
天33 |
演算法服務 algorithm service |
演算法在運行狀態下提供的推理服務。 註:演算法服務接受使用者的應用請求,對輸入資料進行處理,返回處理結果。 |
天34 |
雲服務 cloud service |
通過雲計算已定義的介面,部署在雲端服務器上提供的一種或多種能力。 |
天35 |
邊緣雲服務 edge cloud service |
通過雲計算已定義的介面,部署在邊緣計算設施上提供的一種或多種能力。 |
天36 |
本機服務 local cloud service |
部署在終端或本地計算設施上提供的一種或多種能力。 |
天37 |
人工智慧醫療器材生存週期模型 AI
Medical Device lifecycle model, AIMD |
人工智慧醫療器材從起始到停運的整個演進過程的管理架構。用於確保人工智慧醫療器材在需求分析,設計與開發,確證與確認,部署、運作與監測,再評估、更新直至停運整個過程,維持安全性、有效性及符合性。 註1:在人工智慧醫療器材生存週期中,某些活動可出現在不同的過程中,個別過程可重複出現。例如:為了修復系統的隱錯和更新系統,需要反復實施開發過程和部署過程。 註2:AIMD生存週期模型各階段示例: l 需求分析與考量:明確醫療器材的預期用途、目標人群與臨床需求。定義人工智慧模型的功能(如:診斷、預測、治療或輔助)與性能指標(如:精確度、敏感性、特異性);鑑別法規要求(如:ISO 13485, IEC 62366)、醫療倫理、隱私保護; l 開發與訓練:收集高品質、具代表性的訓練資料,進行人工智慧模型的開發與查證。需確保資料的多樣性與無偏倚性,避免模型過擬合或歧視性結果。執行風險評估,確保模型的透明性與可解釋性,記錄訓練過程以符合法規審查要求。 l 查證、確證與臨床試驗:通過模擬測試與臨床試驗查證人工智慧模型的性能與安全性。需符合法規主管機構(如TFDA、FDA)的臨床評估要求,提交臨床試驗資料。試驗設計涵蓋真實世界資料,查證模型在不同人群與環境中的泛化能力。 l 部署與放入市場:各法規主管機關提交人工智慧醫療器材申請,及支撐技術文件與佐證紀錄,俾取得證書/上市許可;考量部署環境的技術兼容性(如:與電子病歷系統整合)與使用者訓練。需建立異常應變機制,應對部署後的潛在問題。 l 後市場監督與維護:持續監督人工智慧模型的性能,確保其在真實世界中的穩定性與安全性。制定量化監督指標(如:模型準確度、誤差率)並定期評估;當模型性能下降或出現異常(如:資料漂移),啟動更新或停用機制,並提報至負責人工智慧臨床使用的倫理委員會審查。 l 更新與停運:當人工智慧模型不再適用或被新技術取代時,制定退役計畫,確保患者資料安全,執行安全退役,確保資料銷毀符合隱私法規,並更新至新模型。並記錄退役過程以供法規查核。 註3:AIMD生存週期模型的原則: l 安全性:人工智慧醫療器材須確保不對患者造成傷害,特別是在診斷或治療決策中。需執行全方位的風險管理,識別潛在的技術與倫理風險。 l 透明性與可解釋性:人工智慧模型的決策過程需提供追溯性,醫療情境時,醫師與患者需理解模型輸出依據。 l 符合性:遵循國際與當地法規及標準,如:FDA、MDR、ISO 14971,確保產品從設計到停運的全程皆遵循法規與標準。 l 持續改進:人工智慧模型需適應醫療環境的變化,如:新疾病模式或人口結構變化,透過定期更新與再訓練維持性能。 |
沒有留言:
張貼留言