不久前,國家衛(wèi)生健康委、國家中醫(yī)藥局、國家疾控局聯(lián)合發(fā)布《衛(wèi)生健康行業(yè)人工智能應(yīng)用場景參考指引》,列出藥物研發(fā)等84種具體應(yīng)用場景,為人工智能(AI)技術(shù)賦能藥物研發(fā)按下了“快進(jìn)鍵”。
長期以來,在藥物研發(fā)行業(yè)存在一個的“雙十”魔咒,即新藥研發(fā)需要花費(fèi)10年時間、10億美元。如何打破這一魔咒,AI被寄予厚望。在日前召開的學(xué)術(shù)會議上,中國科學(xué)院院士陳凱先表示,AI將為半導(dǎo)體行業(yè)帶來5550億美元的價值,而為制藥行業(yè)帶來的價值可達(dá)1.2萬億美元。
近年來,生成式AI在垂直產(chǎn)業(yè)持續(xù)發(fā)力。它給新藥創(chuàng)制帶來什么?記者了解到,一系列AI技術(shù)的應(yīng)用和平臺建設(shè)正不斷提高藥物研發(fā)效率,人工智能技術(shù)或?qū)⒁l(fā)醫(yī)藥產(chǎn)業(yè)的顛覆性變革。
提升研發(fā)效率 在藥物研發(fā)全鏈條發(fā)揮作用 2023年底,困擾業(yè)界60年的新抗生素發(fā)現(xiàn)難題被AI破題?!蹲匀弧冯s志刊文講述了科學(xué)家運(yùn)用AI技術(shù)發(fā)現(xiàn)抗耐甲氧西林金黃色葡萄球菌(MRSA)的新抗生素的歷程。
以3.9萬種化合物對MRSA的抗菌活性數(shù)據(jù)作為訓(xùn)練“腳本”,麻省理工學(xué)院研究團(tuán)隊(duì)獲得了抗菌能力的評估預(yù)測模型。隨后以3個深度學(xué)習(xí)模型為基礎(chǔ),團(tuán)隊(duì)又“塑造”出化合物人類細(xì)胞毒性的“鑒定師”,對1200萬種化合物進(jìn)行“篩選”,獲得能對抗MRSA又對人體安全的化合物。
這樣的實(shí)驗(yàn),僅靠人力幾乎難以完成。然而,AI憑借“硬核”實(shí)力,大大縮短了對每一個分子進(jìn)行評價和驗(yàn)證的時間。
以往,針對靶點(diǎn)設(shè)計(jì)藥物的成功率非常低。數(shù)據(jù)顯示,即便是《細(xì)胞》《自然》等權(quán)威期刊上報(bào)道過的原始靶點(diǎn),其成藥幾率也小于10%。 靶點(diǎn)有了,為什么設(shè)計(jì)藥物還是難?以小分子化學(xué)藥物為例,依據(jù)“鑰匙開鎖”的原理,針對靶點(diǎn)設(shè)計(jì)化合物,化合物庫中的備選分子多達(dá)成百上千種,篩選耗時耗力。 “新藥研究實(shí)踐表明,要在老靶點(diǎn)上尋找更好的新藥越來越不容易?!标悇P先說,與此同時,新靶點(diǎn)發(fā)現(xiàn)難度也越來越大,需要新思路新技術(shù)“破局”。
而人工智能在新靶點(diǎn)的發(fā)現(xiàn)和預(yù)測方面能為人類提供前所未有的幫助。 陳凱先介紹,國外研究數(shù)據(jù)顯示,人工智能技術(shù)應(yīng)用可以使藥物設(shè)計(jì)時間縮短70%、藥物設(shè)計(jì)成功率提升10倍。
“理論上AI可以對藥物研發(fā)的全鏈條發(fā)揮作用?!标悇P先告訴記者,在新藥研發(fā)的整個鏈條中,一個新靶點(diǎn)的發(fā)現(xiàn)往往會帶動一批新藥產(chǎn)生,推動臨床治療的突破。
“我國尤其需要抓住AI助力醫(yī)藥原創(chuàng)發(fā)展的機(jī)遇期?!标悇P先表示,相關(guān)數(shù)據(jù)顯示,過去十幾年,我國每年發(fā)現(xiàn)的潛在藥物靶標(biāo)數(shù)量始終徘徊在6個以下,我國新藥研究仍以追趕、跟隨為主。
近年來,人工智能技術(shù)正成為發(fā)現(xiàn)新靶點(diǎn)的利器。例如,中國科學(xué)院上海藥物研究所鄭明月等研究團(tuán)隊(duì)發(fā)展“臉譜識別”新算法,通過提取化學(xué)結(jié)構(gòu)特征、基因變化特征、藥物活性特征來關(guān)聯(lián)比對查明新靶點(diǎn)。這一技術(shù)成功用于尋找抗腫瘤老藥甲氨蝶呤的免疫靶點(diǎn)。
AI在從文獻(xiàn)知識中發(fā)現(xiàn)新靶點(diǎn)方面也頗有優(yōu)勢。陳凱先表示,過往基礎(chǔ)和臨床研究積累了大量數(shù)據(jù),這些發(fā)現(xiàn)“互不關(guān)聯(lián)”地分散存儲在研究文獻(xiàn)中,它們之間的潛在關(guān)聯(lián)難以被人類發(fā)現(xiàn)。人工智能具有強(qiáng)大、高效的學(xué)習(xí)分析能力,能夠?qū)⑸⒉荚诖罅课墨I(xiàn)中的關(guān)聯(lián)關(guān)系挖掘出來,推動新機(jī)制、新靶點(diǎn)的識別。
“盡管我國現(xiàn)在還沒有AI輔助研發(fā)的新藥獲批上市,但已經(jīng)有不少新藥在AI協(xié)助下快速進(jìn)入臨床試驗(yàn)階段?!标悇P先說。 降低研發(fā)成本 藥物試驗(yàn)費(fèi)用不再高昂 2024年年底,斯坦福大學(xué)等研究團(tuán)隊(duì)在《細(xì)胞》雜志發(fā)文稱,多尺度、多模態(tài)的大型神經(jīng)網(wǎng)絡(luò)模型已經(jīng)具備表示和模擬分子、細(xì)胞和組織在不同狀態(tài)下行為的能力。在此基礎(chǔ)上,AI虛擬細(xì)胞有了高保真模擬、加速發(fā)現(xiàn)、指導(dǎo)研究的可信性。
此前,《美國國家科學(xué)院院刊》發(fā)文稱,研究者用硅基“病人”替代生命形式的碳基“病人”,模擬結(jié)果與真實(shí)數(shù)據(jù)高度一致。
研究中,1635個“活在電腦里”的“虛擬病人”,患上了乳腺癌且癌細(xì)胞已發(fā)生轉(zhuǎn)移。通過試驗(yàn),研究者找到了生物標(biāo)志物指導(dǎo)乳腺癌臨床治療的優(yōu)化路徑。
基于體外、體內(nèi)、臨床、人群水平和多組學(xué)等數(shù)據(jù),研究者對患者的藥物反應(yīng)進(jìn)行“數(shù)字孿生”,生成“虛擬病人”豐富的藥效藥理數(shù)據(jù),用于生物標(biāo)記物、藥物等方面的測試。
“人類對生命活動的想象和思考,能夠以數(shù)據(jù)的方式傳遞給算力,這是實(shí)現(xiàn)虛擬生命或細(xì)胞的基礎(chǔ)?!北本┐髮W(xué)未來技術(shù)學(xué)院副院長席建忠告訴科技日報(bào)記者,在半個世紀(jì)的發(fā)展歷程中,分子生物學(xué)通過不同層面的組學(xué)數(shù)據(jù)“解讀”生命,如基因組學(xué)、蛋白組學(xué)、轉(zhuǎn)錄組學(xué)等,積累了大量生命科學(xué)數(shù)據(jù)。 隨著技術(shù)融合發(fā)展,人類的數(shù)據(jù)獲取能力越來越強(qiáng)。
“光學(xué)成像技術(shù)現(xiàn)在已達(dá)到納米級別,可以看到細(xì)胞中的細(xì)胞器動態(tài)‘錄像’?!毕ㄖ艺f,大量新數(shù)據(jù)、新研究衍生出成像組學(xué)等新學(xué)科。這些突破在深入解讀生命的同時,也成為數(shù)字生命的基礎(chǔ)。
事實(shí)上,我國科研團(tuán)隊(duì)已在基礎(chǔ)設(shè)施、科研課題等方面早有布局。例如在北京懷柔,耗資數(shù)十億元的多模態(tài)跨尺度生物醫(yī)學(xué)成像設(shè)施已初具規(guī)模,細(xì)胞成像樓、醫(yī)學(xué)成像樓、全尺度整合中心等組成具有硬實(shí)力的科技“航母”,其中,全尺度數(shù)據(jù)處理中心將為相關(guān)研究提供強(qiáng)大算力支持。
“不同團(tuán)隊(duì)正在開展一些關(guān)鍵器官數(shù)字化的工作。我們希望實(shí)現(xiàn)腫瘤細(xì)胞數(shù)字化?!毕ㄖ冶硎?,腫瘤具有高度異質(zhì)性和動態(tài)性,人人不同、時時在變,有效的藥物篩選十分困難。 “虛擬腫瘤細(xì)胞能夠告訴我們,在某一藥物作用下,細(xì)胞內(nèi)部信號通路如何變化?!毕ㄖ艺f,要實(shí)現(xiàn)這樣的目標(biāo),需要基于現(xiàn)有數(shù)據(jù)和基礎(chǔ)模型進(jìn)行腫瘤細(xì)胞“雛形”的構(gòu)建,然后對其進(jìn)行訓(xùn)練。
“現(xiàn)實(shí)生活中,要進(jìn)行藥物試驗(yàn)。如果一位患者吃一種藥,幾千種藥至少需要幾千位患者來試驗(yàn)。這樣一來,實(shí)施困難、成本高。”席建忠說,虛擬細(xì)胞在一套模型中可以同時“吃”幾千種藥,獲得幾千套數(shù)據(jù),實(shí)現(xiàn)高通量和高保真,將極大提升腫瘤藥物的篩選效率。
生成式人工智能令研究者著迷的是它的“出其不意”。席建忠表示,在科學(xué)探索方面,AI能夠打破不同領(lǐng)域的邊界限制。例如,對心血管、傳染病的交叉研究,可能會發(fā)現(xiàn)抗病毒藥物具有降血壓潛力之類的“驚喜”。
縮短研發(fā)周期 啃下罕見病藥物研發(fā)“硬骨頭” 在藥物研發(fā)領(lǐng)域,罕見病藥物研發(fā)是塊難啃的“硬骨頭”。正因?yàn)槿绱?,藥物審評審批為它專門開設(shè)了“孤兒藥”綠色通道。
4年到5年,這是當(dāng)前罕見病診斷的平均耗費(fèi)周期?;颊呱傩纬闪恕盁o米之炊”的困局——罕見病難以“被看見”,臨床試驗(yàn)病例數(shù)少是罕見病藥物研發(fā)的難題之一。
現(xiàn)代醫(yī)學(xué)發(fā)展至今,為什么確診一個病還要耗時這么久? “罕見病并不會帶著‘銘牌’而來。”華大基因AI專項(xiàng)負(fù)責(zé)人梁倫綱告訴記者,它會被當(dāng)作一種常見病,如孩子發(fā)育明顯落后同齡人時,往往會問診營養(yǎng)科。
“罕見病診斷面臨癥狀、基因變異兩端都‘開放’的問題,而確診是要通過各種方法實(shí)現(xiàn)兩端‘收斂’,得到匹配的‘連線’?!绷簜惥V說,患者經(jīng)過各種試錯仍無法找到病因后,才有可能被確診患有罕見病。如今當(dāng)人工智能邁入生成式大模型階段,能夠回答各種開放式問題之后,罕見病診斷有望跳過“試錯”階段。
日前,北京協(xié)和醫(yī)院院長張抒揚(yáng)在國家衛(wèi)生健康委醫(yī)藥領(lǐng)域科技創(chuàng)新發(fā)布會上介紹,首罕見病人工智能大模型GeneT上線,協(xié)助基層醫(yī)生做罕見病的診療。
從回答“是”或“否”的判斷題,到能夠解答“這是什么,為什么”的復(fù)雜問答題,AI提升了罕見病的診斷能力。
“和其他應(yīng)用領(lǐng)域一樣,AI先是快速掌握罕見病領(lǐng)域的專業(yè)知識?!绷簜惥V介紹,公開罕見病數(shù)據(jù)集和文獻(xiàn),以及華大在檢測服務(wù)中的數(shù)據(jù)都會轉(zhuǎn)化為AI的“知識”。重要的是,華大基因與北京協(xié)和醫(yī)院開展合作,及時應(yīng)用罕見病臨床診療中的一線經(jīng)驗(yàn),讓AI具備臨床“經(jīng)驗(yàn)”。
“我們不僅給AI輸入了罕見病的海量知識,還教會它如何像遺傳專家一樣思考?!绷簜惥V介紹,華大基因通過將專家的思考過程轉(zhuǎn)化為AI能理解的語言,讓新模型GeneT學(xué)會精篩選導(dǎo)致罕見病的基因變異,效率提升20倍,且在模擬和真實(shí)病例中的準(zhǔn)確率分別達(dá)到99%和98%。 梁倫綱表示,目前GeneT在完成初步分析后,確診還需要專家把關(guān)。
資料顯示,在人工智能大模型的助力下,罕見病患者的確診時間有望從數(shù)年縮短到4周以內(nèi),這使得絕大部分罕見病無效藥的“冰山”開始松動。
數(shù)據(jù)顯示,我國2017—2022年期間的在研罕見病藥物數(shù)量大幅增加,年均增長率達(dá)34%。然而,《中國臨床藥學(xué)雜志》的一項(xiàng)研究顯示,約43.9%罕見病藥物臨床試驗(yàn)實(shí)際入組人數(shù)小于目標(biāo)入組人數(shù)。 在國家罕見病登記系統(tǒng)的支持下,罕見病臨床隊(duì)列相繼建立,以推動相關(guān)領(lǐng)域藥物研發(fā)。
“這讓罕見病患者得到早診斷。”梁倫綱表示,罕見病“被看見”,將緩解罕見病藥物研發(fā)臨床隊(duì)列稀缺的問題,為罕見病藥物研發(fā)提供有力支撐。 專家認(rèn)為,未來3—5年,我國將進(jìn)入AI藥物研發(fā)快速發(fā)展階段,人工智能技術(shù)將肩負(fù)起分子優(yōu)化、合成路線設(shè)計(jì)以及自動生成、自動分析、自動篩選的全流程研究工作。
“我們期待第一個AI設(shè)計(jì)研發(fā)的藥物能夠盡快獲批上市。成果轉(zhuǎn)化和落地應(yīng)用仍舊是醫(yī)藥產(chǎn)業(yè)實(shí)現(xiàn)高質(zhì)量發(fā)展的‘命門’?!毕ㄖ艺f。