AI大模型在應用場景落地過程遇到的挑戰(zhàn),在醫(yī)療場景下幾乎都存在,甚至時常表現(xiàn)得“尤為突出”。
針對醫(yī)療AI通常的可解釋、可溯源功能需求,部分技術企業(yè)基于積累的通用醫(yī)學知識預訓練大模型,采用多Agent+ReAct思維鏈跟隨的結構,提升大模型診斷準確性,并補充發(fā)現(xiàn)和解釋患者可能存在的疾病,得到醫(yī)療專家的認可。
過去一年,中國國內的AI大模型行業(yè)應用出現(xiàn)了井噴式增長。北京市尤為重視AI的發(fā)展,出臺了一系列舉措,加上得益于擁有豐富的科技資源和創(chuàng)新環(huán)境,在AI應用領域已經形成了完整的創(chuàng)新和產業(yè)鏈條。
近日,北京市科委、中關村管委會發(fā)布了《北京市人工智能大模型行業(yè)應用分析報告》(以下簡稱《分析報告》),向市場呈現(xiàn)了北京市AI大模型創(chuàng)新應用發(fā)展態(tài)勢,并尋求向全國乃至全球貢獻“北京智慧”和“北京方案”。
該《分析報告》以近期舉辦的北京市人工智能行業(yè)大模型創(chuàng)新應用大賽為切入點進行了介紹,聚焦政務、金融、產業(yè)升級、醫(yī)療、文化教育、智慧城市6個賽道進行了系統(tǒng)分析和闡述。
《分析報告》介紹了北京市人工智能行業(yè)大模型創(chuàng)新應用大賽在醫(yī)療領域的兩個賽題方向及完成情況。這兩個賽題方向分別由北京協(xié)和醫(yī)院、北京友誼醫(yī)院提出。
再比如,在輔助診療中要求醫(yī)療大模型具備可解釋和可溯源功能。不同疾病??频脑\療思路和治療方式差異大,但共同點是明確診療依據(jù),加強診斷準確性。部分參賽企業(yè)基于積累的通用醫(yī)學知識預訓練大模型,采用多Agent+ReAct思維鏈跟隨的結構,提升大模型診斷準確性,并補充發(fā)現(xiàn)和解釋患者可能存在的疾病,得到醫(yī)療專家的認可。
場景落地遇重重挑戰(zhàn)
當然,意料之中的是AI大模型應用必然面臨一些挑戰(zhàn)?!斗治鰣蟾妗肪土信e了一些:
算力需求持續(xù)增長,掣肘大模型落地應用;知識產權、數(shù)據(jù)隱私與大模型應用之間的佳平衡點仍在探索中;大模型幻覺問題有所改善,但距離規(guī)模落地尚有差距;部分大模型應用處于“可用階段”,需求方和技術企業(yè)協(xié)同發(fā)力讓“可用”邁向“好用”;部分領域積極響應監(jiān)管需要,對大模型落地提出特殊要求。
AI大模型應用遇到的上述挑戰(zhàn),在醫(yī)療場景下基本上都存在,甚至時常體現(xiàn)得“尤為突出”。
比如,大模型訓練涉及的數(shù)據(jù)可能包括一些版權保護的作品,可能需要禁止使用,避免生成侵權回答。然而,面對數(shù)量龐大、來源各異、權屬不同的訓練數(shù)據(jù),若采用事先授權許可的方式則過程漫長、復雜且?guī)缀鯚o法落地操作。
在數(shù)據(jù)隱私保護方面同樣如此,它與大模型應用之間的技術平衡點也仍然在探索中,目前還存在一個兩難的問題——既要大限度地保護數(shù)據(jù)隱私,又要大限度地發(fā)揮大模型的效果。
政務、醫(yī)療和金融領域尤為突出。如何通過開發(fā)可信的框架,從而在“既要……又要……”的困難中取得一種平衡,是目前業(yè)內討論的重點方向,仍在探索中。
再比如,金融、醫(yī)療、教育等領域在政策、數(shù)據(jù)隱私、倫理安全等方面有較高監(jiān)管需要,需求方和技術企業(yè)積極響應,在凝練場景、開放數(shù)據(jù)、模型訓練等過程中考慮監(jiān)管因素,在項目交付時考慮所屬領域可能存在的特殊要求。
領醫(yī)知識島(ID:LYZSD666)注意到,在此次由北京協(xié)和醫(yī)院、北京友誼醫(yī)院分別出題的復賽中,就出現(xiàn)了兩種數(shù)據(jù)使用情形。
協(xié)和醫(yī)院賽題方向的復賽所用訓練數(shù)據(jù)集由重癥醫(yī)學領域知識文獻、操作指南、專業(yè)試題庫和入院病歷樣例四部分組成,不涉及患者臨床信息,通過脫敏處理后可供參賽企業(yè)帶回,進行部署調試。
“北京方案”給出三個研判、三個建議
醫(yī)療領域核心場景重視準確性及可解釋性;醫(yī)療數(shù)據(jù)治理面臨隱私及標準化的挑戰(zhàn);醫(yī)療機構私有化落地成本較高。
比如,診斷場景作為醫(yī)療領域的核心場景,需要大模型結果準確、可回溯、可驗證。這對技術企業(yè)提出了更高的要求。不少技術企業(yè)將大模型嘗試應用于科研及教學環(huán)節(jié),推動醫(yī)療AI更快實現(xiàn)應用落地。
在醫(yī)療數(shù)據(jù)治理層面,當前醫(yī)療AI產品訓練所需的基礎數(shù)據(jù),均來源于醫(yī)療機構在不同時期逐步部署的異構信息系統(tǒng),不同醫(yī)療機構之間的數(shù)據(jù)仍難以互聯(lián)互通、共享共用,這些都阻礙了進一步分析利用。同時,對醫(yī)療數(shù)據(jù)的嚴格管理、保護,都限制了AI大模型在醫(yī)療領域的商業(yè)化落地。
此外,大模型在資金、時間、算力、硬件設施和環(huán)境等方面具有高昂的開發(fā)和運營成本。這些無疑都對醫(yī)療機構私有化部署醫(yī)療大模型增加了難度。
此,《分析報告》提出了AI大模型在醫(yī)療領域發(fā)展的三條建議:
一是,從醫(yī)療全流程入手,開放有價值業(yè)務場景;二是,推動構建北京市醫(yī)療大模型公共數(shù)據(jù)集;三是,大模型技術企業(yè)與醫(yī)院IT解決方案供應商加強合作。
比如,從開放業(yè)務場景方面,《分析報告》認為從加快場景落地考慮,在持續(xù)推進醫(yī)療診斷等核心業(yè)務的同時,拓展醫(yī)療行業(yè)全領域業(yè)務場景,從互聯(lián)網(wǎng)診療、診前診后全流程管理、科研場景、民營醫(yī)院入手,鼓勵本市大模型團隊找準行業(yè)或場景數(shù)據(jù)優(yōu)勢錯位發(fā)展,探索大模型在醫(yī)療領域的商業(yè)化模式和產業(yè)化發(fā)展路徑。
再比如,在推動構建北京市醫(yī)療大模型公共數(shù)據(jù)集方面,《分析報告》認為:協(xié)同各類主體加快構建高質量的醫(yī)療領域公共訓練數(shù)據(jù)集,推動醫(yī)療數(shù)據(jù)泛知情同意,按照盡職免責原則實現(xiàn)數(shù)據(jù)出院。在有效提升醫(yī)療數(shù)據(jù)的質量方面,《分析報告》也給出了較細致的建議。
此外,關于大模型技術企業(yè)與醫(yī)院IT解決方案供應商加強合作方面,《分析報告》認為:醫(yī)院通常有固定合作的IT解決方案供應商,其他技術企業(yè)全新建立與醫(yī)院的合作關系較為困難。大模型技術企業(yè)需要結合自身的技術特征、目標場景等要素,選擇合適的醫(yī)院IT解決方案供應商進行合作。
多數(shù)需求方認可大模型價值
RAG、智能體、多模態(tài)技術有明顯作用
盡管遇到的挑戰(zhàn)重重,但是也不乏一些能夠帶來信心的信息。《分析報告》就概述了現(xiàn)階段AI大模型應用呈現(xiàn)出的一些典型特征:
大模型穿越邊緣場景,向核心場景挺進;央國企擁抱新技術,加快大模型在產業(yè)升級、金融等領域的落地步伐;大模型應用搭建難度下降,“動態(tài)行業(yè)大數(shù)據(jù)”成為落地新關鍵;需求方情況各異,在采購、部署大模型時特色鮮明;大模型安全逐漸受到重視,為可持續(xù)發(fā)展提供保障。
比如,經過近一年的高速發(fā)展,AI大模型在政務、金融、產業(yè)升級、醫(yī)療等各個領域均有落地應用。在產業(yè)升級領域,以知識問答、代碼補全等場景為主;在文化教育領域,以內容潤色、內容糾錯等場景為主;在醫(yī)療領域,以醫(yī)療文書生成、智能醫(yī)藥問答等場景為主。
上述場景大多為所屬領域的邊緣場景,不涉及生產、運營的核心環(huán)節(jié),也不面向公眾或外部客戶使用,僅面向內部員工使用。不過,得益于在邊緣場景價值的成功驗證及其技術演進,大模型也開始向核心區(qū)挺進。
在場景價值驗證方面,多數(shù)需求方認可大模型價值,將計劃追加投入。整體而言,大模型技術演進主要包括檢索增強生成(RAG)、智能體(AI Agent)和多模態(tài),對擴大大模型應用范圍有明顯作用。
檢索增強生成技術(RAG)主要用于解決大模型幻覺問題;智能體技術(AI Agent)則可以實現(xiàn)大模型應用的能力升級,賦予大模型感知、規(guī)劃、記憶和使用工具的能力,實現(xiàn)獨當一面。
多模態(tài)技術則是使交互模態(tài)擴展至文本、圖片、音頻、視頻等多種模態(tài),可提升大模型應用的產品功能和交互體驗,推動大模型應用從可用向好用轉變。