2024年1月8日 星期一

人工智慧可以預測人們生活中的事件

日期20231218
資料來源丹麥技術大學
摘要人工智慧可以分析有關人們居住、教育、收入、健康和工作條件的登錄資料並以甚高精確程度預測生活中事件。
丹麥技術大學『人工智慧可以預測人們生活中的事件』。 ScienceDaily20231218日。< www.sciencedaily.com/release/2023/12/231218125850.htm >
來源:
Materials provided by Technical University of Denmark

註:此文並未涵蓋該文件全部事項,相關內容務須參閱各項文獻原本及最新版次。此處係閱讀隨筆,僅供個人學習,非供印刷或潛在意圖出版。

© All Rights reserved.

開發以建置模型書面語言的人工智慧(AI)可用於預測人們生活中的重大事件。哥本哈根科技大學(DTU),國際通訊聯合協會和美國東北大學的一項研究項目顯示,如果使用大量有關人們生活的資料並訓練所謂的「轉換式模型」 (例如ChatGPT)用於處理語言,則可以系統地組織資料並預測一個人的生活,甚至估計死亡時間。

在一篇新的科技論文「利用生命事件序列來預測人類生活」自然(Nature)計算科學(Computational Science), 研究人員以稱為life2vec的模型分析了600萬丹麥人的健康資料和參與勞動力市場的群體。在初始階段對模型進行訓練之後,亦即了解資料中的模式,該程式已被證明優於其他先進的神經網路,並以甚高精確程度預測重大事件,諸如:個性和死亡時間之類的結果。

DTU教授和本文的第一作者蘇內.蕾曼(Sune Lehmann)說明:「我們使用該模型解決了基本問題:我們可以根據個別人士過去的條件和事件在多大程度上預測該人在未來的重大事件? 從科學上講,對我們來說令人興奮的不僅僅是預測本身,而是使模型能夠提供如此精確答案的資料面向。」。

死亡時間預測

該程式Life2vec的預測是對一般問題的答案,例如:「四年內死亡」?  當研究人員分析模型的反應時,結果與社會科學中的現有發現一致;例如:所有事情都是平等的,處於領導者地位或高收入的個別人士更有可能生存,而男性、熟練或曾有過心理診斷經驗者,則聯繫到更高的死亡風險。Life2vec將資料編碼放入大型向量系統中,該向量組合是組織不同資料的數學結構。該模型決定在哪裡放置有關出生、求學、教育程度、薪水,住宿和健康的資料。

蘇內.蕾曼(Sune Lehmann)說:「令人興奮的是將人類生活視為一系列事件,類似於語言中的句子如何由一系列單詞組成。這通常是使用AI中的轉換式模型的任務類型,但是在我們的實驗中,我們使用它們來分析我們所謂的生命序列,即., 人類生活中發生的事件。」 。

提出倫理問題

本文的研究人員指出,圍繞life2vec模型的倫理問題,例如保護敏感資料隱私以及資料偏見的作用。在使用該模型之前,必須更深入地了解這些挑戰,例如,評估個人患疾病或其他可預防的生命事件的風險。

蘇內.蕾曼(Sune Lehmann)說:「該模式開闢了重要的積極和消極觀點,可以在政治上進行討論和解決。如今,在科技公司中已經使用了類似的預測生命事件和人類行為的技術,例如,追踪現代人在社交網路上的行為,非常準確地向我們展示, 並使用這些配套的文件預測現代人的行為並影響現今社會。這種討論必須成為民主對話的一部分,以便現代人考慮技術將現代人帶去何處,以及這種方式是否是我們想要的發展方向。」

根據研究人員的說法,下一步將是合併其他類型的資訊,例如:文件和圖像、或有關我們的社會聯繫的資訊。資料的這種使用打開了社會與健康科學之間的全新互動。

研究項目

研究項目“利用生命事件序列來預測人類生活”基於勞動力市場資料和來自國家患者登記處(LPR)和丹麥統計局的資料。資料集包括所有600萬丹麥人,並包含有關收入、薪水、津貼、工作類型、行業、社會福利等的資訊。健康資料集包括對醫療保健專業人員或醫院的訪問記錄、診斷、患者類型和緊急程度。資料集跨越2008年至2020年,但在一些分析中,研究人員專注於2008-2016年期間以及受到年齡限制的個別人士。

轉換式模型

轉換式模型是一種人工智慧,用於學習語言和其他任務的深度學習資料系統式結構。吾人可以對模型進行訓練以理解和生成語言。轉換式模型被設計為比以前的模型更快、更高效,並且通常使用大型資料集執行訓練大型語言模型。

神經網路

神經網路是受人類和動物的大腦和神經系統啟發的計算機模型。神經網路有很多不同類型的(例如轉換式模型)。像大腦一樣,神經網路由人造神經元組成。這些神經元是連接彼此的,可以相互發出及傳送訊號。每個神經元從其他神經元接收輸入訊號,經過計算然後傳遞給其他神經元的輸出訊號。神經網路可以通過訓練大量資料學習解決任務。神經網路依靠訓練資料來學習和提高其準確性。但是,一旦對這些學習算法進行了精確調整,便成為計算機科學和人工智慧方面的強大工具,使我們能夠高速對資料進行分類和分組。Google的搜索算法是最著名的神經網路之一。 

詳細內容參見原論文。




沒有留言: