ChatGPT,是由人工智能研究實驗室 OpenAI 于2022年11月30日發(fā)布的全新聊天機器人模型——人工智能技術驅動的自然語言處理工具。ChatGPT能夠通過學習和理解人類的語言來進行對話,還能根據(jù)聊天的上下文進行互動,真正像人類一樣來聊天交流,還能完成撰寫郵件、視頻腳本、文案、翻譯、代碼等任務。 自推出以來,ChatGPT強大的能力備受關注。
研究團隊 測試了GPT-4在具有挑戰(zhàn)性的醫(yī)療病歷中的做出準確診斷的能力 ,測試結果顯示,生成式人工智能GPT-4在 近40%的時間里選擇了正確的診斷作為其首要診斷,并在三分之二的具有挑戰(zhàn)性的病例中提供了正確的潛在診斷。
生成式人工智能 (Generative AI) 指的是一種人工智能,它使用經(jīng)過訓練的模式和信息來創(chuàng)建新內容,而不是簡單地處理和分析現(xiàn)有數(shù)據(jù)。生成式人工智能的的例子就是火遍全球的聊天機器人ChatGPT,它使用人工智能的一個分支——自然語言處理 (NLP) ,使計算機能夠理解、解釋并生成類似人類的語言。 基于生成式人工智能的聊天機器人是一種強大的工具,有望改變創(chuàng)意產(chǎn)業(yè)、教育、客戶服務等領域。
然而,人們對它們在臨床環(huán)境中的潛在表現(xiàn)知之甚少,比如復雜的診斷推理。 該論文的通訊作者、哈佛醫(yī)學院的 Adam Rodman 博士認為, 人工智能的新進展為我們帶來了生成式人工智能模型,這些模型能夠基于文本的詳細反應,在標準化的醫(yī)學檢查中取得高分。我們想知道這樣一個生成式人工智能模型是否能像醫(yī)生一樣“思考”,所以我們要求一個模型來解決用于教育目的的標準化復雜診斷案例。
而結果顯示,它做得非常非常好。 為了評估聊天機器人GPT-4的醫(yī)療診斷技能,研究團隊使用了臨床病理病例會議 (CPC) 發(fā)布的一系列復雜且具有挑戰(zhàn)性的患者病例,包括相關的臨床和實驗室數(shù)據(jù)、成像研究和組織病理學發(fā)現(xiàn)。 在評估70例CPC病例時,GPT-4的診斷結果中有27例 (39%) 與CPC診斷完全匹配。在64%的病例中,CPC診斷包括在了GPT-4的診斷列表中,這寫診斷列表包含了可能的疾病類型,可以解釋患者的癥狀、病史、臨床表現(xiàn)和實驗室或成像結果。
GPT-4的診斷得分,5分代表診斷完全準確,4分代表診斷中包含一些非常接近但不準確的結果,3分代表診斷中包括一些密切相關的可能有幫助的結果,2分代表診斷中包括一些相關內容但不太可能有幫助,0分代表沒有接近目標的診斷結果。
雖然聊天機器人還不能取代訓練有素的醫(yī)療專業(yè)人員的專業(yè)知識,但生成式人工智能是人類診斷認知的一個很有前途的潛在輔助工具。它有可能幫助醫(yī)生理解復雜的醫(yī)療數(shù)據(jù),拓寬或改進我們的診斷思維。我們需要對這項技術的佳用途、益處和局限性進行更多的研究,還有很多隱私問題需要解決,但這對未來的診斷和病人護理來說,都是令人興奮的發(fā)現(xiàn)。
這項研究進一步證明了人工智能技術在醫(yī)療診斷領域的應用前景,進一步的調查將有助于我們更好地了解這些新型人工智能模型如何改變醫(yī)療保健服務。