資訊
頻道
當(dāng)前位置:首頁(yè) > 醫(yī)療器械資訊 > 行業(yè)資訊 > 上海長(zhǎng)征醫(yī)院專家?guī)阕x懂人機(jī)大戰(zhàn)背后的套路

上海長(zhǎng)征醫(yī)院專家?guī)阕x懂人機(jī)大戰(zhàn)背后的套路

文章來(lái)源:放射沙龍發(fā)布日期:2018-07-07瀏覽次數(shù):247

近幾天,全國(guó)很多地方都是高溫酷暑,但是周圍不少影像科醫(yī)生因?yàn)榭吹结t(yī)學(xué)影像“人機(jī)大戰(zhàn)”的文章,感覺(jué)被澆了一盆冷水,急著跑來(lái)問(wèn)我醫(yī)學(xué)影像科醫(yī)生的出路到底在哪?鑒于文章廣泛的社會(huì)影響力,我覺(jué)得應(yīng)該站出來(lái)提出一些自己的疑問(wèn)和看法。

作為早一批接觸人工智能的醫(yī)生,近兩年我見(jiàn)證了整個(gè)領(lǐng)域的飛速發(fā)展。很多企業(yè)從一開(kāi)始的無(wú)人問(wèn)津,火熱到現(xiàn)在的動(dòng)輒幾億元融資。在眾多博人眼球的新聞報(bào)道和企業(yè)宣傳文章中,有效或傳播力度具爆炸性的恐怕就是所謂的“人機(jī)大戰(zhàn)”了。

IBM深藍(lán)”到“谷歌AlphaGo”,一個(gè)個(gè)棋類大師“倒在”機(jī)器人手下,直到今天醫(yī)學(xué)影像界的“人機(jī)大戰(zhàn)”也不期而至。我早接觸醫(yī)學(xué)影像人機(jī)大戰(zhàn)是在2017年底,當(dāng)時(shí)央視有一檔“機(jī)智過(guò)人”節(jié)目,一個(gè)號(hào)稱“啄醫(yī)生”的機(jī)器人工智能模型和15個(gè)醫(yī)學(xué)影像專家在節(jié)目中比賽找肺結(jié)節(jié)??赐暌院螅X(jué)得雖然節(jié)目為了傳播效果存在一些誤導(dǎo),但起碼規(guī)則明確,能讓人看懂,能讓像我一樣的影像科醫(yī)生找出問(wèn)題所在并提出問(wèn)題。而近越來(lái)越多的“人機(jī)大戰(zhàn)”,已經(jīng)讓我們這些從業(yè)者看不太懂了。

人機(jī)大戰(zhàn)為了證明什么?

“人機(jī)大戰(zhàn)”到底為了證明什么?機(jī)器出具的影像科報(bào)告比醫(yī)生更準(zhǔn)確?還是在極個(gè)別領(lǐng)域彌補(bǔ)醫(yī)生的不足?

以近期傳播比較廣泛的一篇報(bào)道為例,其中就指出“機(jī)器分別以87%、83%的準(zhǔn)確率,戰(zhàn)勝醫(yī)生戰(zhàn)隊(duì)66%、63%的準(zhǔn)確率?!边@個(gè)“準(zhǔn)確率” 到底是指什么呢?是腫瘤病灶檢出正確率?定位正確率?量化正確率?還是良、惡性診斷正確率?另外,檢查方法到底是用CT還是MRI(磁共振)?一連串疑問(wèn)令人不解。難道是機(jī)器出具的影像科報(bào)告比醫(yī)生更準(zhǔn)確?

我們醫(yī)院在醫(yī)學(xué)影像人工智能領(lǐng)域已經(jīng)深耕了2年時(shí)間,也有大量機(jī)器比影像科醫(yī)生“厲害”的科研證據(jù),但都是局限在極個(gè)別單項(xiàng)上能彌補(bǔ)醫(yī)生的“先天不足”。比如微小肺結(jié)節(jié)的檢出,醫(yī)生因?yàn)榫δ土ρ哿Φ扔邢?,確實(shí)不如機(jī)器找的準(zhǔn)、找的快。再比如對(duì)病灶體積的測(cè)量,以前醫(yī)生也只是從連續(xù)二維圖像上估測(cè),而機(jī)器可以做到更快更的測(cè)量。但是,所有這一切只是把原來(lái)醫(yī)生做的不夠完美的方面進(jìn)一步推向,完全談不上取代醫(yī)生,只是給醫(yī)生提供了一件更稱心的工具,僅此而已。

說(shuō)句題外話,我還很為參賽的影像專家們捏把汗。根據(jù)報(bào)道,參賽醫(yī)生團(tuán)隊(duì)只有60%左右的“準(zhǔn)確度”,這種報(bào)道難道不會(huì)對(duì)他們的職業(yè)生涯造成影響嗎?患者們會(huì)放心地找這樣的醫(yī)生團(tuán)隊(duì)看病嗎?

1、比賽成績(jī)能說(shuō)明臨床應(yīng)用效果嗎?

跟大家分享一個(gè)真實(shí)案例。之前有過(guò)一個(gè)檢出肺結(jié)節(jié)的醫(yī)學(xué)影像人工智能競(jìng)賽,后團(tuán)隊(duì)的準(zhǔn)確率在競(jìng)賽小數(shù)據(jù)集測(cè)試達(dá)到90%的準(zhǔn)確率,但是真正把模型拿到實(shí)際臨床環(huán)境中測(cè)試,發(fā)現(xiàn)只有不到60%準(zhǔn)確率,可以說(shuō)完全沒(méi)有臨床可用性。

其實(shí),要想說(shuō)清楚這個(gè)問(wèn)題,就涉及到有關(guān)“人機(jī)大戰(zhàn)”另外幾個(gè)重要指標(biāo):

1.比賽測(cè)試題來(lái)源,測(cè)試題與訓(xùn)練集的關(guān)系,測(cè)試題數(shù)據(jù)處理的方法;

2.金標(biāo)準(zhǔn)如何制定,包括數(shù)據(jù)入組標(biāo)準(zhǔn),征象判斷標(biāo)準(zhǔn),結(jié)果判斷標(biāo)準(zhǔn)等。

首先,為什么測(cè)試題來(lái)源很重要?測(cè)試題來(lái)源是檢測(cè)AI模型表現(xiàn)穩(wěn)定性的關(guān)鍵因素;也是檢驗(yàn)其是否存在小數(shù)據(jù)刷準(zhǔn)確率等常用的“機(jī)器考試刷分”的方法;同樣也是優(yōu)質(zhì)醫(yī)療資源能否順利下沉的基礎(chǔ)指標(biāo)。例如,模型如果只在同一個(gè)數(shù)據(jù)源中(可以理解為同一家醫(yī)院)反復(fù)大量訓(xùn)練,那么該模型就會(huì)只適應(yīng)該數(shù)據(jù)源中的數(shù)據(jù)。換句話說(shuō),就是同一家醫(yī)院出來(lái)的片子模型識(shí)別效果好,但是換一家醫(yī)院,模型效果就完全沒(méi)法看。所以,如果不注明測(cè)試題的來(lái)源,無(wú)論有什么樣的公正機(jī)構(gòu)把關(guān),都說(shuō)明不了該模型的臨床應(yīng)用價(jià)值。優(yōu)質(zhì)醫(yī)療資源下沉,解決“偏遠(yuǎn)地區(qū)”老百姓看病問(wèn)題更是天方夜譚。

其次,為什么金標(biāo)準(zhǔn)規(guī)則制定很重要?因?yàn)樗求w現(xiàn)測(cè)試結(jié)果科學(xué)性的關(guān)鍵指標(biāo)。我們經(jīng)常在各種企業(yè)宣傳的文章中看到,諸如肺結(jié)節(jié)檢出率高達(dá)98%等等非?!傲裂邸钡臄?shù)據(jù)。但是金標(biāo)準(zhǔn)規(guī)則制定完全避而不談。后我們刨根問(wèn)底去查,發(fā)現(xiàn)其中很多是4mm以下甚至6mm以下的肺結(jié)節(jié)不作為結(jié)節(jié)計(jì)算,所以這個(gè)98%的“亮眼”數(shù)據(jù)只是一個(gè)含水分的噱頭。

2、關(guān)于誤導(dǎo)及暗示

值得警惕的是,目前的很多公開(kāi)報(bào)道或宣傳緊緊抓住了大眾的恐懼心理,不斷植入一些場(chǎng)景,會(huì)讓人相信機(jī)器人已經(jīng)可以替代影像科醫(yī)生。比如,很多報(bào)道中會(huì)提到“某某機(jī)器人影像診斷能力相當(dāng)于一個(gè)職稱醫(yī)師級(jí)別的水平”。首先,職稱醫(yī)生終診斷結(jié)果是符合臨床使用場(chǎng)景的,目前哪個(gè)機(jī)器人能夠做到?另外,還有報(bào)道表面宣稱“人工智能不能替代醫(yī)生,因?yàn)獒t(yī)生還能做給患者提供人文關(guān)懷等機(jī)器不能完成的工作”,這些假設(shè)的前提就是建立在醫(yī)生現(xiàn)有工作已經(jīng)被機(jī)器取代。如果認(rèn)可這一說(shuō)法,實(shí)際上就是以被誤導(dǎo)和暗示為“前提”。我可以告訴你,在現(xiàn)實(shí)中根本不存在討論這個(gè)“影像科醫(yī)生不出報(bào)告還能干什么”這個(gè)話題。

3、什么項(xiàng)目適合“人機(jī)大戰(zhàn)”

從宣傳的角度,其實(shí)任何形式的“人機(jī)大戰(zhàn)”都能博取到足夠多的眼球,因?yàn)榇蟊娤猜剺?lè)見(jiàn)。我也能理解企業(yè)的“良苦用心”。畢竟之前有“IBM深藍(lán)”及“谷歌AlphaGo”的宣傳神話在。但是大家應(yīng)該留意的是,棋類游戲是非常適合人機(jī)大戰(zhàn)的。因?yàn)槠孱愑螒蛴蟹浅C鞔_的限制條件,且有定義明確的規(guī)則,同時(shí)也是零和博弈。在這個(gè)閉合空間內(nèi),人類和機(jī)器來(lái)做比拼。

而反觀現(xiàn)實(shí)中的臨床環(huán)境,可以總結(jié)為規(guī)則不斷變化的游戲的無(wú)限集合。任何時(shí)候出現(xiàn)重大發(fā)展,游戲規(guī)則都要重寫(xiě)。在這樣一種環(huán)境下,憑借我們目前訓(xùn)練的模型跟醫(yī)生比較高低,本身就是對(duì)醫(yī)生的“侮辱”。更重要的是,在醫(yī)學(xué)影像工作場(chǎng)景中,醫(yī)生跟機(jī)器人是非零和博弈,是合作共生的關(guān)系,這也是跟棋類游戲本質(zhì)不同。所以,我們認(rèn)為醫(yī)學(xué)影像工作場(chǎng)景并不適合做單純的“人機(jī)大戰(zhàn)”。你見(jiàn)過(guò)哪個(gè)廚師非要徒手跟刀具比切菜?當(dāng)然除了“手撕包菜”。

4、總結(jié)

當(dāng)然,也有可能我們了解信息不夠全面,沒(méi)有掌握AI新的發(fā)展水平,歡迎大家一起來(lái)更新關(guān)于“人機(jī)大戰(zhàn)”賽事更多信息,讓我們這些影像科醫(yī)生更真切地了解目前技術(shù)的發(fā)展現(xiàn)狀。我們同時(shí)也希望有關(guān)這方面討論能夠持續(xù)報(bào)道,讓普通百姓了解醫(yī)學(xué)影像行業(yè),也讓醫(yī)學(xué)影像的從業(yè)者有機(jī)會(huì)反思自己真正的價(jià)值所在。

在我看來(lái),就像過(guò)去人類歷史上經(jīng)歷過(guò)的一切科技變革,人工智能也將融入醫(yī)生的工作流程,與醫(yī)生群體一起更好地造福廣大病患。很多人愿意引用威廉·吉布森的名言“未來(lái)已來(lái),只是分布不均”。目前看來(lái)也的確如此,只是有很多“未來(lái)”還分布在人們的想象和恐懼以及“不可告人”的目的當(dāng)中。

醫(yī)學(xué)影像界擁抱真正的人工智能,我們同樣也支持人工智能企業(yè)的宣傳。但是不要再拿目前人工智能簡(jiǎn)單的圖像視覺(jué)與人類復(fù)雜的生物體大腦進(jìn)行比賽,來(lái)博取大眾關(guān)注,增加大眾的恐慌情緒。我們?cè)敢鉃槟芙鉀Q實(shí)際問(wèn)題的AI產(chǎn)品站臺(tái),反對(duì)做不良企業(yè)市場(chǎng)行為的幫兇。只有大家一起營(yíng)造AI發(fā)展的良好生態(tài),才能推進(jìn)醫(yī)學(xué)影像健康發(fā)展,希望不要在有些功利浮躁的“虛火”下,燒壞了AI這顆幼苗。