宙、資料與資訊一般辭彙
|
序號
|
名詞
|
定義與說明
|
宙1
|
資料採擷
data mining
|
對於定量資料,通過從不同視角和維度分析、分類並總結潛在的聯繫和影響,以此提取模式的計算過程。
從大量資料中發現有價值資訊的過程。涉及運用統計學、機器學習和人工智慧技術來分析資料集,以識別模式、趨勢和關聯,此等資訊通常是隱含的,無法通過簡單查詢或手動分析得以發現。
|
宙2
|
人員考核personnel examination
|
是為了保證標注人員/仲裁人員的能力與標注要求一致的測試過程。
|
宙3
|
資產asset
|
對個人或組織有價值的任何東西。
|
宙4
|
攻擊 Attack
|
(人工智慧)破壞、洩露、篡改、損傷、偷竊、未授權訪問或未授權使用資產的企圖。旨在破壞或利用人工智慧系統的完整性、可用性和機密性。攻擊大致分為若干類型:對抗攻擊、後門攻擊、模型萃取攻擊、成員推理攻擊、模型逆向攻擊、資料隱私洩露、惡意軟體檢測與防禦入侵、對抗樣本防禦。
|
宙5
|
真實性Authenticity
|
一個實體正是其所聲稱實體的特性。
係為人工智慧系統的真正智慧或真實智慧的體現。涉及人工智慧是否能夠理解其環境、獨立思考、進行推理、自主學習、基於理解的情境做出決定、從而解決問題,以及在複雜情境中表現出與人類智慧相仿的能力,而不僅僅是通過預程式設計的規則、資料的統計模式或簡單的資料處理而逕行預測、制式回應或完成既定任務。
|
宙6
|
授權Authorization
|
獲得訪問資料和功能的許可權。
(人工智慧)授權過程是人工智慧系統獲取訪問特定資源或執行特定任務許可權的過程。在人工智慧應用中,授權可以涉及到用戶查證、代理者身份查證、許可權控制和訪問權限管理等面向。
|
宙7
|
利用 Exploit
|
明確用於通過漏洞破壞資訊系統安全的方法。
|
宙8
|
抗抵賴性
Non-Repudiation
|
證明所聲稱事態或行為的發生及其發起實體的能力,以解決有關事態或行為發生與否以及事態中實體是否牽涉的爭端。
源自資訊安全領域概念,係指通訊雙方在資料交換過程中,確保發送方不能否認已發送的資料,接收方不能否認已接收的資料。此概念強調資料的不可抵賴性,通常通過數位簽章、加密和時間戳記等技術手段予以實現。
應用階段確保機器學習模型的訓練資料、演算法參數以及模型輸出的完整性和可信度。
註:亦稱「非否認性」。
|
宙9
|
隱私 Privacy
|
不因不正當或非法收集和使用有關個人的資料而侵犯其私人生活或事務的自由
|
宙10
|
個人資訊 personal information
|
以電子或者其他方式記錄的能夠單獨或者與其他資訊結合識別特定自然人身份,或者反應特定自然人活動情況的各種資訊。例如:姓名、身份證件號碼、通信/通訊聯繫方式、住址、帳號密碼、財產狀況、行蹤軌跡等。
註:亦稱「個人隱私資訊」。
|
宙11
|
個人一般資訊 personal general information
|
除【個人敏感資訊】以外的個人資訊。
|
宙12
|
存取控制 access control
|
基於業務要求和安全要求,確保授權和受限的訪問資產的手段。
|
宙13
|
脆弱性vulnerability
|
可能會被威脅所利用的資產或控制措施的弱點。
註1:亦稱《脆弱度》、《易受傷害性》、《易損性》、《漏洞》。
註2:脆弱性可能位於物理環境、組織結構、業務過程、人員、管理、硬體、軟體及通訊設施等面向。
註3:脆弱性是與資產緊密相連,是資產本身具備的、可能受到威脅利用的弱點。威脅須利用脆弱性才會對組織造成危害。
|
宙14
|
[電子]欺騙 spoofing
|
假冒成合法的資源或用戶。
通過偽造或篡改資料、輸入或身份,欺騙人工智慧系統使其產生錯誤判斷或行為的技術。此種攻擊可能針對模型的輸入、訓練資料或系統交互環節,目的是誤導人工智慧以達到惡意目的。通常欺騙行為的途徑與方式如:
l 輸入欺騙:以精心構造的輸入項目,可能是圖像、音訊、文本,誘使人工智慧系統的模型出現偏差或產生誤判。
l 毒性訓練資料:攻擊者隱瞞、篡改、潛藏模型的訓練資料,植入竄改後的偏差或後門程式,在特定情境時俟機促發模型依循設定步驟動作、改變途徑、引導干涉或直接失效。
l 身份欺騙:偽造人類的生物特徵:如人類臉孔模態、指紋樣式、聲紋、視網膜,欺騙誤導人工智慧的身份查證系統。
l 對抗性攻擊:利用模型漏洞蓄意生成對抗性樣本,通常針對深度學習模型。
l 系統交互型欺騙:模仿合法使用者或醫療器材,與人工智慧系統交互作用。
可行之因應對策,如:宜增強輸入檢測、引入健壯性訓練、運用多參數查證、輸入輸出資料的重複查證等。
|
宙15
|
威脅threat
|
可能導致對系統或組織的損害的不期望事件發生的潛在原因。
|
宙16
|
專家系統 expert system
|
一種基於知識的系統,他根據由人類專家經驗開發出的知識庫進行推理,來解決某一特定領域或應用範圍中的問題。
|
宙17
|
醫學圖像分割 medical image segmentation
|
一種醫學影像處理方法,根據臨床治療或研究需求把醫學圖像分成若干個特定的、具有獨特性質的區域,並提取出圖像中包括器官、病灶等感興趣目標的技術和過程。
|
宙18
|
醫學圖像分類medical image classification
|
一種醫學影像處理方法,根據醫學圖像資訊中所反映的不同特徵,對不同類別的醫學圖像進行分類。
|
宙19
|
醫學圖像配准medical image registration
|
一種醫學影像處理方法,將不同時間、空間、模態採集的醫學圖像通過演算法映射到另一個坐標系的過程。
|
宙20
|
醫學圖像目標檢測medical image object detection
|
一種醫學影像處理方法,從醫學圖像中找出包括病灶、器官、組織等在內的感興趣的目標,並確定其位置和類別。
|
宙21
|
醫學圖像成像加速 Medical imaging acceleration
|
一種醫學圖像成像技術,通過超解析度重建、低劑量重建等加速演算法提高各種醫學成像設備的成像速度。
|
宙22
|
醫學圖像模態轉換Medical imaging modality transformation
|
醫學影像處理方法之一,從一種影像模態轉換到另一種影像模態。旨在增強醫學影像診斷的準確性、效率和患者體驗。有鑑於不同成像技術的物理特性及臨床應用互有長短,如:CT的高分辨率宜於骨骼成像,但須防範電離輻射效應;MRI適宜於軟組織對比成像,但掃描時間長致使成本增加;超音波適宜即時成像但依賴操作者經驗判斷潛在可疑部位。大致分為七個應用考量面向:
1.
影像分析與診斷:人工智慧演算法,特別是深度學習模型,能夠從CT、MRI、X光等影像資料中提取複雜特徵,輔助醫生查看、評估及判斷疾病檢測和診斷。
2.
影像融合與轉換:通過人工智慧技術,不同模態的醫學影像可以被融合和轉換,以提供更全面的病灶資訊。這種多模態融合不僅提高了診斷的準確性,還為個性化治療方案提供了依據。例如,人工智慧整合CT與MRI影像資料,生成更為詳細和準確的三維重建圖像,供醫生更直觀地理解病變區域。
3.
圖像增強與去噪:人工智慧技術可以增強醫學影像的清晰度,減少雜訊,使得細微結構更易被識別。在低劑量CT掃描中尤為重要,可以減少輻射暴露同時保持診斷品質。
4.
自動化與智慧化:人工智慧醫療器材能夠自動化完成部分影像分析任務,如分割腫瘤邊界、量化病變體積等,減輕醫生的工作負擔,提高工作效率。同時,這些系統能夠提供即時回饋,輔助醫生做出決策。
5.
可解釋性與透明度:隨著人工智慧在醫學影像中的廣泛應用,提高模型的可解釋性和透明度成為研究熱點。例如,中山六院的研究團隊構建的基於Vision
Transformer的模型,不僅預測直腸癌患者的生存率,還能解釋其預測結果的依據,增強醫生對人工智慧輸出的信任。
6.
法規與符合性:儘管人工智慧技術在醫學影像領域展現出巨大潛力,但其應用仍需遵循嚴格的法規要求。美國食品藥品監督管理局(FDA)已批准多種基於人工智慧和機器學習的醫療器材,尤其在放射學領域。此等器材的開發、評估和臨床應用皆需符合相關法規,確保安全性和有效性。
7.
成本效益與普及性:人工智慧醫療器才的發展亦需考慮成本效益,以促進醫療領域的廣泛應用。通過提高診療效率、減少誤診和漏診,人工智慧技術有望降低醫療成本,提升醫療服務的可及性和品質。
|
|
|
|
洪、資料集一般辭彙
|
序號
|
名詞
|
定義與說明
|
洪1
|
計數檢驗inspection by attributes
|
關於規定的一個或一組要求,或者僅將單位產品劃分為合格或不合格,或者僅計算單位產品中不合格數的檢驗。
|
洪2
|
計量品質特徵 variable quality characteristics
|
被檢的單位產品特性能用連續尺度進行度量的品質特性。
|
洪3
|
計量抽樣檢驗 sampling inspection by variables
|
按規定的抽樣方案從批中隨機抽取一定數量的單位產品。用測量、試驗或其他方法取得它們的質量特性值,與品質要求進行對比,並判斷該批產品能否接收的過程。
|
洪4
|
批 lot
|
按抽樣目的,在基本相同條件下組成的總體的一個確定部分。
|
洪5
|
保全[性] security
|
對電腦硬體、軟體進行的保護,以防止其受到意外的或蓄意的存取、使用、修改、毀壞或洩密。保全性也涉及對患者隱私、元資料、通訊以及電腦安裝的實質性保護。
|
洪6
|
資訊保全information security
|
對資料進行的保護,以防止其受到意外的或蓄意的存取、使用、修改、毀壞或洩密。
保全性也涉及對受試者隱私、元資料、通訊以及電腦安裝的物理保護。
註:亦稱《信息保全[性]》。
|
洪7
|
可攜性 portability
|
資料集能被安裝、替換或從一個系統移動到另一個系統中,並保持已有品質的屬性的程度。
註:亦稱《可攜性》。
|
洪8
|
離群值outlier
|
在一組資料中,被認為與該組其他觀察值具有明顯不同特徵的那些觀察值。
註:亦稱《異常值》。
|
洪9
|
資料集描述 dataset description
|
陳述資料集各種性質的文件。
|
|
|
|
荒、資料集標注辭彙`
|
序號
|
名詞
|
定義與說明
|
荒1
|
標注任務 annotation task
|
(a)
按照資料標注規範對指定資料集進行標注的過程。
(b) 有目的地對一批資料進行分析、添加外部知識的活動。
|
荒2
|
標注對象 annotation object
|
標注任務分析的具體資訊,如:資料的類型、特徵、屬性等。
|
荒3
|
標注工具 annotation tool
|
用於輔助標注/仲裁人員產生標注結果的一系列軟體/硬體工具。
|
荒4
|
標注平臺 annotation platform
|
開展標注任務的資訊管理系統
|
荒5
|
標注規則 annotation instruction
|
資料需求方用於明確標注任務和標注資料的操作規範,應包含標注物件定義、所用標注工具和標注 平臺、標注格式、標注前的準備工作、標注後的處理工作等。
|
荒6
|
結構化標注 structured annotation
|
使用固定的格式、固定的規則記錄結果的標注任務。
|
荒7
|
非結構化標注 non-structured annotation
|
使用不固定的格式、不固定的規則記錄結果的標注任務。
|
荒8
|
半結構化標注 semi-structured annotation
|
使用固定的格式、不固定的規則記錄結果的標注任務。
|
荒9
|
手工標注 manual annotation
|
完全由人工執行的標注任務。
|
荒10
|
自動標注 automatic annotation
|
完全由機器執行的標注任務,標注完成後由人工審查。
|
荒11
|
半自動標注 semi-automatic annotation
|
(a)由人工和機器混合完成的標注任務。
(b)使用人工結合自動化工具的方式進行資料標注。
|
荒12
|
語義標注 semantic annotation
|
以資料代表的涵義和關係為標注對象的標注任務。
|
荒13
|
標注人員 annotator
|
具備完成特定任務目標、並滿足品質要求的適任能力、執行標注任務、對標注結果有直接貢獻的人員。
註1:包括初級標注人員、審查人員、仲裁人員等。
註2:通常情況,要求人員的適任能力,仲裁人員高於審查人員,審查人員高於初級標注人員。
|
荒14
|
初級標注人員 initial annotator
|
執行標注任務、做出初步標注結果的人員。
|
荒15
|
審查人員 annotation reviewer
|
對初步標注結果進行審查與品質管制的人員。
|
荒16
|
仲裁人員 arbitrator
|
當多名標注人員對同一資料的標注結果不一致時,負責做出最終結果的人員。
|
荒17
|
標注人員績效 annotation performance
|
標注人員執行標注任務的能力表現。
|
荒18
|
標注責任組織annotation responsible organization
|
組織各項活動展開標注任務、對標注品質負擔直接責任的實體。
|
荒19
|
標注流程annotation process
|
產生標注結果需要遵循的步驟。
註:通常包含《依次標注》和《獨立標注》兩種過程,《依次標注》過程首先由初級標注人員進行標注,然後其標注結果交由審查人員進行審核,如審查人員認可該結果,則該結果成為最終的標注結果,否則交由仲裁人員通過仲裁方式決定最終的標注結果。《獨立標注》過程係分別由若干名標注人員,各自獨立對原始資料進行標注,然後將各人的標注結果經由仲裁方式產生最終的標注結果。
|
|
|
|
日、預訓練模型辭彙
|
序號
|
名詞
|
定義與說明
|
日1
|
預訓練模型pre-trained model
|
已在資料集上經過訓練的計算模型,可用作新任務的基礎.
註:預訓練模型狹義上通常用於遷移學習,其中模型在一個源任務上進行預訓練,然後在下游任務上進行微調;在 廣義上,預訓練模型可能作為機器學習模型的初始值,供下游任務進行微調.
|
日2
|
預訓練模型說
pre-trained model description
|
陳述預訓練模型各種性質的文件.
|
日3
|
任務域task domain
|
機器學習模型需要解決的特定問題或任務的領域.
註:在人工智慧醫療器材的應用中任務城的示例有:影像病灶檢測、影像學徵象分類、影像R(OI(感興趣區域)分
割、超聲視頻分割、影像報告生成、心電信號檢測、圖像生成、流程優化等.
|
日4
|
源任務source task
|
用於訓練機器學習模型的初始任務.
|
日5
|
對抗訓練Adversarial Training
|
通過添加對抗樣本來訓練模型的一種方法,用於提高模型對抗性的能力。
|
日6
|
生成模型 generative
model
|
一種通過學習資料分佈,專注於資料集的分佈,以返回給定示例的概率,來生成新的資料樣本的深度學習模型,如VAE和GAN等。
|
日7
|
變分自編碼器Variational Autoencoder, VAE
|
一種深度學習模型,由一個編碼器和一個解碼器組成;前者學習將重要的潛在變數與訓練資料隔離開來,再由後者使用這些潛在變數重建輸入資料。能以訓練所輸入資料的變體形式生成新資料。除此之外,VAE亦可執行其他自編碼器常見的任務,例如去噪。
|
日8
|
生成對抗網路Generative Adversarial Network, GAN
|
一種通過對抗生成和判別模型來生成逼真的資料樣本的深度學習模型。
GAN主要應用目標承擔生成式任務,如:生成、重建、超分辨率、風格遷移、補全、上採樣等;由生成器生成網路,通過輸入生成圖像,再由判別器執行二次分類,將生成器生成圖像作為負樣本,真實圖像作為正樣本,再由學習生成器使得由判別器對生成圖像的評分盡可能接近正樣本作為目標來訓練,迭代執行,使生成器產生的結果愈來愈逼真。
|
日9
|
判別模型 discrimination model
|
一種通過學習類別之間的界限,基於條件概率對看不見的資料進行預測,來分類資料樣本,主要用於監督學習任務。它直接對輸入資料和輸出標籤之間的關係進行建模,目標是學習一個函數或概率分佈,能夠準確地區分不同類別的資料。判別模型專注於預測資料的標籤,而不是生成資料的分佈。可用於分類或迴歸問題陳述的深度學習模型,如CNN(卷積類神經網路)和RNN(遞迴類神經網路)等。判別模型的優點在於可以利用較少的資料進行訓練,並且在相同量的訓練資料下,通常比生成模型具有更好的實際效果。然而,判別模型無法生成新的資料實例,且對異常值的處理可能不如生成模型。
|
日10
|
卷積類神經網路Convolutional Neural Network, CNN
|
一種深度學習算法,主要用於處理具有網路結構的資料,如圖像、影像處理和電腦視覺的深度神經網路,能夠自動學習資料中的空間特徵,採用卷積操作提取圖像特徵。由卷積層、池化層及全連接層組成。
l 卷積層:使用卷積核(篩檢程式)對輸入資料進行局部連接和權值共用,提取局部特徵,如邊緣和紋理。
l 池化層:通過下採樣減少特徵圖的維度,提高對輸入變化的魯棒性,通常使用最大池化。
l 全連接層:將特徵圖展開為一維向量,進行分類或迴歸計算。
經過局部感知和權值共用,有助於減少參數量,降低過擬合風險,並高效處理圖像資料。通過堆疊多層卷積和池化操作,可以構建深層網路,從而捕捉更複雜的特徵。
|
日11
|
遞迴類神經網路Recurrent Neural Network, RNN
|
一種適用於序列資料處理的深度神經網路,由輸入層、一個隱藏層和一個輸出層組成,通過迴圈連接來保留先前的狀態資訊。
|
日12
|
多層感知器 multilayer perception, MLP
|
一種最早提出的前向結構的人工神經網路,映射一組輸入向量到一組輸出向量,由多個全連接層組成。每一層都全連接到下一層。多層感知器遵循人類神經系統原理,學習並進行資料預測。它首先學習,然後使用權重存儲資料,並使用算法來調整權重並減少訓練過程中的偏差,即實際值和預測值之間的誤差。
|
日13
|
消失型梯度
vanishing gradient
|
是深度學習的一種現象,尤其在使用反向傳播演算法訓練深層神經網路時常可見到。在深層神經網路此種現象表現為在訓練過程中,隨著網路深度的增加,通過鏈式法則的連乘效應計算出的梯度在反向傳播到網路較淺的層時變得極其微小,甚至接近於零。故導致較淺層的參數更新幾乎停滯,遂引致深層網路難以學習的問題。影響整個網路的訓練效果。
|
日14
|
激增型梯度 exploding
gradient
|
在深度學習訓練神經網路過程中,由於反向傳播演算法中梯度的連乘效應,導致深層網路參資料越來越大的問題。
此過程將使得梯度值變得非常大,導致參數更新過於劇烈,使得模型的權重發散,從而無法正常訓練。此種現象通常發生在深層網路中,尤其是反向傳播時,梯度的累積放大了原本的導資料,導致了梯度的指數級增長。
|
日15
|
微調fine tuning
|
在遷移學習中,利用已有模型的參數作為初始值,對新任務採取更進一步的訓練。
|
日16
|
單樣本學習One-Shot Learning
|
一種在只有一個或極少量樣本的情況下,學習識別新類別的機器學習方法。
|