(見前篇)
18. 組織的人工智慧系統運作良好,只是背景環境出現新的狀況,已經處理過的冗贅型偏差,應當如何處理?
考慮到外界發生變化的重要性,可能有必要對人工智慧系統針對冗贅型偏差進行全面再評鑑。已實施偏差評估技術須考慮下列事項:
- 識別出來的相關群體及使用者
- 地理位置、語言語系、社會經濟或文化性背景環境;
- 人工智慧系統現今運作狀況。
使用人工智慧系統後,外界的變化可能作用到已經完成評估及部署的人工智慧系統的偏差。外界變化導致須考慮的其它要素,如下列:
- 考量取用性,包括潛在選項及矯正機制的可獲得性、失能人士的配套措施等;
- 監督管制減少偏差的效應,採用減少偏差方法可能失敗或惡化偏差風險;
- 持續的使用者回饋。
- 組織須監督及文件化外界的變化影響冗贅型偏差風險,以期符合組織風險管理過程。
可能影響做出決定之某些外界的變化,舉例說明如下:
- 既有的人工智慧系統在不同的環境展開,包括不同的使用者、目標市場或資料來源,將會改變風險,因此要求為冗贅型偏差再評鑑人工智慧系統;
- 歷經多時,實際世界現象映射到系統的輸入及輸出事項會改變,俗稱「漂移」。例如:使用機器學習模式做出決定的系統表現,當基於原先機器學習模式訓練之相關事項,隨著時空變遷而改變的話,可能出現衰變而較易發生偏差;
- 當系統使用新的案例可能發展出(無論是有意為之或有機作用)影響關於冗贅型偏差的風險;
- 社會性規範會與時俱變,如:性別行為規範的態度、理想型身材、吸煙。
凡有外界的相關事項改變,如:量度、風險、利害相關者或要求事項,人工智慧系統的偏差須予以識別、再評估,並加以處理。
19. 分散式人工智慧系統生命週期的偏差與管理方式
國際標準ISO/IEC 22989第8.6.2節記錄若干結合型訓練,涉及雲端或邊際訓練(edge training),以及新浮現方法學的應用方式,如:聯邦型學習(federated learning)、邊際訓練,無需在單一位置為之,可以在任一網路分佈各地的終端機器進行。
國際標準ISO/IEC 22989的圖3展示人工智慧系統的生命週期,得以運用在部署分散式學習(distributed learning),在分散式網路的每個訓練邊緣端點,可能經由雲服務,從事宛如交響樂團般管理多方登入之整體性訓練。各分散式登入者應非均勻分佈在人工智慧系統的生命週期各個實施細部內容,故應多加考慮。如下所示:
- 跨及多參與節點的協調式人工智慧開發過程有助於最大限度地減少由於開發過程中的變動性而引入的額外偏差。協調方法包括使用相同的資料擷取、轉換、載入過程和工具,及相互類似的訓練環境,對照出每個節點資料分佈的協同一致的確證策略,按照分散式性質管理保全性和隱私性(例如:使用可信賴的執行環境),包括:識別、評鑑和處理從分散式中出現的新不利風險的風險策略,對應著分散式設置中出現的新不利風險,以及納入負責該項設置的實體在內的整體治理策略。
- 訓練方法學(如:聯邦式學習)需要一個如交響樂團般的管理實體,通過使用特定的聚積演算法(aggregation algorithm)來組合每個分散式訓練節點上的個別訓練。選擇合適的聚積演算法甚為重要,須考慮涵括各訓練節點的資料分佈方式,以確保聚積作業時不會遺漏採樣不足資料(或等級)的節點,或者具有過度採樣資料(或等級)的節點在模型的聚積版本中不會過分突顯。
- 由於分散式網路中的資料分佈方式各不相同,因此須按照需要調整開發的人工智慧系統之查證和確證任務。在人工智慧系統生命週期的啟動階段,組織宜為資料分佈的適宜系統制定適宜的查證和確證策略指引。宜使用該標準中提供的指引,在每個訓練節點和如交響樂團般的管理實體中處理冗贅型偏差。
- 管理分散式人工智慧系統的生命週期極具挑戰性。若要緩解此等挑戰,組織須識別適宜的量度,並在分散式訓練網路中收集相同的量度。這些量度提供一種機制,用於偵測從既定實際做法的偏差,並執行任何矯正措施,以確保符合一致的過程和實際做法。整合的機器學習操作實際做法有助於進一步自動化此種管理方式。
20. 銷毀與紀錄保存
當移除人工智慧系統或其中某些元件後,組織須確保合宜地保存文件化及資料:
支援資料集或機器學習模組(未來)再次得到運用;
即使移除資料集後,可供調查人工智慧系統(雖然資料遭到移除)的歷史事件或潛在存在過的冗贅型偏差。
對人工智慧系統或機器學習而言,資料是非常重要的。移除過程須擴及遭到移除的資料。資料移除可能引起新的考量事項,涉及保存、保全及私密性。(參見ISO/IEC/IEEE 12207建議事項)。
註:ISO/IEC 5338第6.4.17節定義生命週期最末過程是銷毀。另提供解釋銷毀過程係適宜地結束系統或元件的存在。組織需要考慮合約、政策及環境、法規、安全或保全等各種適用的面向。
註:ISO/TR 8344,第5.9節陳述在結構化資料環境裡移除個別紀錄的關切情況。第5.10節陳述在相關型資料庫既要移除又要參照整體性規則的衝突之關切情況。
註:ISO 15489-1,第8.5節建議組織成立移除權責單位,以掌握移除作業。第9.9節係移除過程建議。
21. 延伸閱讀建議
- ISO/IEC TS 12791:2024 資訊技術—人工智慧—處理機器學習任務中分類和迴歸的冗贅型偏差
- ISO 22458:2022,弱勢的消費者—設計和交付包容性服務的要求和準則
- ISO/IEC 5259-1:2024, 人工智慧—資料品質供分析與機器學習—第一部份—整體觀察、專業辭彙、案例
- ISO/IEC 23053:2022, 使用機器學習的人工智慧系統架構
- ISO/IEC 23894,資訊技術—人工智慧—風險管理指引 (另文介紹)
- ISO/IEC TR 24027:2021, 資訊技術—人工智慧—在人工智慧系統內及人工智慧輔助做決定帶有的偏差
- ISO/IEC 25012:2008, 軟體工程學—系統產品的品質要求事項與評估(SQuaRE)—資料品質模型
- ISO/IEC 25059:2023,軟體工程學—系統產品的品質要求事項與評估(SQuaRE)—人工智慧系統的品質模型
- ISO/IEC/IEEE 29119-1:2022, 系統與軟體工程學—軟體測試—第一部分:通用概念
- ISO/IEC/IEEE 29119-2:2021, 系統與軟體工程學—軟體測試—第二部分:試驗過程
- ISO/IEC 42001:2023,資訊技術—人工智慧—管理系統 (另文介紹)
- ISO/IEC 42005,資訊技術—人工智慧—人工智慧系統衝擊評鑑
(本篇竟)