目前在AI行業(yè),大模型火到破圈。
今年11月初,華為云盤古大模型的機場廣告在首都機場和深圳寶安機場亮相,主打“行業(yè)AI開發(fā)應用優(yōu)選”的定位。11月18日,權威時政媒體中國新聞周刊官方微博發(fā)布了華為云盤古大模型海報,引發(fā)了廣泛關注。
以往,AI大模型這類基礎設施層面的前沿技術極少在大眾廣告渠道被看到。如今,大模型不僅成為眾多AI行業(yè)峰會中被高頻討論的熱詞,在AI行業(yè)之外的影響力也日漸擴大。這些都表明,AI大模型正在加速走出實驗室,成為賦能各行各業(yè)的通用AI基礎設施。
自2020年OpenAI推出NLP大模型GPT3至今,全球范圍內AI大模型迎來大爆發(fā),參與企業(yè)越來越多,參數級別越來越大,成為新一輪AI競賽的賽場。目前,大模型吸引了谷歌、微軟、英偉達、華為、智源研究院、百度、阿里、商湯、浪潮、中科院自動化所等科技巨頭和科研機構參與其中,各家大模型的參數量級也從千億、萬億,迅速躍遷到了10萬億級別。
同時我們也看到,大模型火爆的背后卻面臨廣泛應用的困局。技術很牛,落地很難,不夠接地氣,成為業(yè)界對大模型發(fā)展的普遍認知。大模型百家爭鳴的格局背后,AI行業(yè)更需要冷思考。
AI大模型應該為應用而生
為什么眾多科技巨頭扎堆推出大模型?
這要回歸到AI落地的核心挑戰(zhàn)。國際歐亞科學院院士、華為云人工智能領域首席科學家、IEEE Fellow田奇認為,AI進入千行百業(yè)面臨很多挑戰(zhàn),其中重要有三點:第一,AI場景碎片化使得AI技術難以大規(guī)模復制。傳統(tǒng)的定制化、作坊式的模型開發(fā)方式是“一個場景一個模型”,無法復用和積累,導致AI開發(fā)的高門檻、高成本。第二,如何將行業(yè)知識與AI技術相結合,跨越行業(yè)know how與AI技術之間的鴻溝。第三,AI技術一直面臨攻擊、隱私、安全以及可解釋性方面的難題。
AI大模型擁有超大規(guī)模參數、巨量訓練數據,通過模型的巨量化可以提高人工智能的通用屬性,并降低人工智能的應用門檻。正因為直擊AI落地的挑戰(zhàn),大模型成為很多AI企業(yè)的共識。
那么,AI大模型能帶來科學計算的范式革命嗎?目前還存在哪些局限?10月底,華為云AI院長峰會匯聚了AI產學研各界的強大腦,來自華為的AI科學家與來自中國科學院、中國工程院以及國內30余所高校的數十名院長、教授關于AI大模型的現(xiàn)狀和前景進行了專業(yè)的探討。各界大咖普遍認為,目前AI大模型大挑戰(zhàn)在應用落地,如何讓更多行業(yè)和場景真正用起來。
首先,不是所有場景都需要大模型。大模型在醫(yī)藥研發(fā)、衛(wèi)星遙感、災害評估、自然生態(tài)監(jiān)測等場景有巨大價值,但一些數據量小、任務并不復雜的場景,并不適合使用大模型,相當于“大炮打蚊子”。
其次,大模型不是參數數量越大越好,如何廣泛應用才是大價值和難點。大模型應用價值取決于其泛化能力,能否快速適配不同場景。
一位AI領域教授認為:“大模型不在于大,而在于能不能解決應用的問題,是不是來自于真正的需求。怎么樣能夠在更廣泛的應用場景中用起來,這是目前大模型非常大的挑戰(zhàn)?!?/span>
“大模型應該是AI走向下一個時代的跳板。大模型的大一定是體現(xiàn)它能夠去掌握、組織更大量的數據,而不是模型的參數量大?!币晃蝗A為云研究員也持同樣的觀點。
第三,大模型不是的,不應該希望一個大模型能解決所有問題。
“如果大模型想要實際用的比較好,一定要有配套的工作流。如果把下游的工作流程給搭建起來,大模型在很多場景上能夠得到比較好的應用?!痹撗芯繂T表示。
深入AI落地的無人區(qū)
如果說參數的直觀對比類似外行看熱鬧,那么,落地能力才是大模型實力的真正較量。
目前,大模型在落地層面還處在探索的初期,各大科技巨頭都在摸索嘗試。其中華為云盤古大模型在行業(yè)應用方面走得更遠,已經在能源、零售、金融、工業(yè)、醫(yī)療、環(huán)境、物流等行業(yè)的100多個場景實際應用, 讓企業(yè)的AI應用開發(fā)效率平均提升了90%。
今年4月華為云發(fā)布的盤古系列預訓練大模型具有超大規(guī)模參數、超高精度的特質,還提供模型預訓練、微調、部署和迭代的功能,以減少行業(yè)側的數據標注依賴,從而降低人工智能開發(fā)的門檻和成本。
華為云盤古系列大模型包括NLP(中文語言)大模型、CV(視覺)大模型、多模態(tài)大模型和科學計算大模型。盤古大模型家族還在不斷壯大,今年9月華為云新推出盤古藥物分子大模型,其研究了17億個小分子的化學結構,可以高效生成藥物新分子,計算蛋白質靶點匹配,預測新分子生化屬性,并對篩選后的先導藥進行定向優(yōu)化,實現(xiàn)全流程的AI輔助藥物設計。
在眾多行業(yè)場景中,還存在著大量AI尚未落地的無人區(qū)。其中很多場景都有這樣的特征:樣本復雜多樣且不均衡,如果使用傳統(tǒng)AI模型標注成本高、效率低、準確率也有待提升。這些場景正是盤古AI大模型的典型應用場景之一。盤古大模型把自己化作AI世界的開路先鋒,深入傳統(tǒng)AI模型難以觸及的領域,不斷探索AI落地的前沿。
在電力行業(yè),國網重慶永川公司在智能電力巡檢場景用無人機代替人工進行缺陷檢測,但面臨海量數據標注工作量大和缺陷種類繁多等問題。盤古 CV 大模型利用海量無標注電力數據進行預訓練,并結合少量標注樣本微調的高效開發(fā)模式,提出了針對電力行業(yè)的預訓練模型。應用之后,樣本篩選效率提升約 30 倍,篩選質量提升約 5 倍,以永川每天采集 5 萬張高清圖片為例,可節(jié)省人工標注時間 170 人天。
同時,結合華為云盤古大模型搭載的自動數據增廣以及類別自適應損失函數優(yōu)化策略,可以做到一個模型適配上百種缺陷,一個模型就可以替代永川原先的 20 多個小模型,極大地減少了模型維護成本,平均精度提升 18.4%,模型開發(fā)成本降低 90%。
在金融行業(yè),金融機構擔保貸款通常要求企業(yè)提供不動產擔保。原因在于動產移動性較強,很難控制動產的去向和價值,監(jiān)管難度大,銀行提供貸款風險較高。因此動產很難作為抵押物進行融資貸款,造成中小企業(yè)融資難的困境。
浦發(fā)銀行的浦惠云倉項目利用人工智能、物聯(lián)網、區(qū)塊鏈、金融科技等相關技術,能夠智能地監(jiān)測收貨、入庫、在庫、出庫等環(huán)節(jié),識別異常行為,確保貨物“不調包”和貨物數量準確。該項目采用華為云盤古大模型,用一個模型覆蓋全部9種物流場景,通過對人員異常行為、入庫/出庫異常檢測、叉車軌跡異常識別等全部流程檢測,實現(xiàn)了對動產的實時監(jiān)管,增強了銀行風控能力。另外數字化也提高了動產解質押、出庫、進入市場等環(huán)節(jié)的流通時間,將原來的為120天資金占用回款周期縮短到20-30天,大幅降低了企業(yè)的融資成本。
在生態(tài)監(jiān)測方面,華為云盤古科學計算大模型實現(xiàn)了對全球海浪浪高的實時預測,在精度和覆蓋范圍與傳統(tǒng)科學計算相當的基礎上,將預測速度提升到了原來的10,000倍。
在時尚產業(yè),華為云盤古多模態(tài)大模型強大的跨模態(tài)檢索、跨模態(tài)生成能力,不斷延伸AI的創(chuàng)造力。通過以文搜圖和以圖搜文能力,可以實現(xiàn)趨勢預測。通過以文生圖和以圖生圖能力,盤古多模態(tài)大模型可以通過文本控制來快速生成服裝圖片,供人類設計師參考。
的泛化能力是如何煉成的?
當大模型普遍受困于落地難題,為什么盤古大模型率先做到了廣泛應用?這離不開其開發(fā)過程中采用的眾多領先技術。
比如,盤古大模型在對比度自監(jiān)督學習中引入了樣本相似性,使得小樣本學習的能力獲得了顯著提升。盤古 CV 大模型是判別與生成聯(lián)合預訓練的模型,其小樣本學習性能在 10% 的標簽分類上精度達到了業(yè)界第一。盤古大模型首創(chuàng)采用“階段式訓練”和“動態(tài)冰化”策略,顯著提升大模型訓練的穩(wěn)定性和效率;在下游應用中,僅需少量樣本和學習參數即可完成千億規(guī)模大模型的快速微調和下游適配等等。
作為盤古大模型的“設計師”,田奇此前曾表示,盤古大模型設計之初秉持了三個核心原則:“第一,網絡規(guī)模要大;第二,模型大但不能臃腫,有強壯的網絡架構,希望它是百米,系統(tǒng)的性能要做到,綜合性能提升10%以上;第三,希望它有的泛化能力,也就是場景覆蓋率要高,不僅是單項的百米,也希望是10項全能。”
之所以堅持這樣的技術路線,源自盤古大模型的初衷:讓AI開發(fā)由作坊式向工業(yè)式轉變,降低行業(yè)AI開發(fā)應用門檻,讓大模型真正走進千行百業(yè),不再只是大資本和大實驗室的專屬。在AI走向千行百業(yè)過程中,華為云盤古大模型在行業(yè)落地方面快人一步,能夠幫助行業(yè)專家快速掌握AI技能。
“華為云AI的目標就是持續(xù)創(chuàng)新,打造人工智能黑土地,使能大規(guī)模、可復制的AI行業(yè)應用?!碧锲姹硎?。
放眼全球AI產業(yè),大模型已經成為國際間AI技術競爭的一個熱點,通過大模型構筑中國AI技術競爭壁壘,是這一代中國科技企業(yè)的機遇和挑戰(zhàn)。中國工程院院士、鵬城實驗室主任、北京大學信息科學技術學院院長、教授高文院士曾經指出,中國的人工智能產業(yè)有政策支持、數據資源、應用場景、青年人才四個長板。其中,豐富的數據資源和應用場景是我國AI產業(yè)非常突出的優(yōu)勢。
如何將散落在各行各業(yè)的數據生產要素價值發(fā)揮到,AI大模型大有可為。尤其是當AI大模型與行業(yè)專家的知識相結合,必將開啟新一輪的AI應用浪潮,爆發(fā)出巨大的價值。