4月8日,人工智能大模型技術高峰論壇在杭州蕭山開幕。
證券時報·e公司從現場了解到,出席此次活動的嘉賓,不僅包括多位重量級院士嘉賓,華為云人工智能領域首席科學家田奇也現身,并就人工智能發展趨勢、盤古大模型的進展及應用等熱點話題,在會上進行了分享。
大模型是未來AI生態的核心
今年以來,人工智能持續在全球升溫,在這輪新的人工智能浪潮中,田奇稱,人工智能發展,已經從局部探索,走向千行百業。AI正在走進企業核心生產系統,開始創造更大價值;人工智能行業滲透率提速,2026年將達到20%。
在田奇看來,人工智能發展趨勢呈現兩大特點:首先是從小模型到大模型;其次是人工智能與科學技術的交匯。
據介紹,大模型成為應對AI領域應用碎片化的一種方式。這種方式下,提高了模型泛化能力,減少了對于領域數據標注的依賴和模型微調;模型復雜度(參數個數)持續爆發,不到半年增長了10倍,達到了1750億。
同時,大模型有可能收編高度定制化的小模型,導致市場向大模型集中。這主要是因為,開發大模型資金門檻高,開發和訓練一次,需要1200萬美元;技術門檻高,具有對AI框架深度優化和超強的并行計算能力。
另外,大模型正在改變AI產業的規劃與格局。比方說,牽引AI產業快速收斂,構建AI產業的底座;匯聚和沉淀行業生態及開發者生態,形成產業生態黏性。
AI在哪些科學計算場景能發揮“尖刀”作用?“工業、氣象、能源、生物醫學等眾多領域,都受到了人工智能的深刻影響?!碧锲娣Q,大模型是連接技術生態和商業生態的橋梁,是未來AI生態的核心。
“AI for Industries是人工智能新的爆點”
除了行業的發展趨勢,田奇也談到了盤古大模型的進展和趨勢。田奇稱,華為盤古大模型正在推動人工智能開發從“作坊式”到“工業化”升級。
據介紹,2019-2021年,華為開始了盤古大模型的立項研發,并在2021年4月份開發出了盤古基礎大模型,隨后又陸續發布了多個盤古行業大模型系列。譬如,2021年9月份,開發了盤古藥物分子大模型;2022年6月,盤古礦山大模型;2022年11月份,盤古氣象、海浪、金融OCR等領域大模型發布。
“大模型是AI產業快速發展的必然選擇,行業正在從‘大煉模型’轉向‘煉大模式’?!碧锲娣Q,傳統AI時代,不同場景對應不同小模型,一個場景一個模型,模型參數小,泛化性差。大模型時代,大模型吸取海量知識,適配多業場景,多個場景一個模型,模型參數大,泛化性強。
譬如,GPT-2,參數為15億,到了GPT-3,參數為1750億。盤古大模式,參數達到了千億級。Switch Transformer,參數已達到了16000億。多參數,可以掌握海量知識背后的邏輯,有極高泛化能力;同時,還可以降低研發成本,自監督學習,減少標注數據,解決人工標注成本高,周期長,準確度不高問題。
據介紹,華為盤古大模型,具有優秀的泛化能力,可以充分挖掘數據內的聯系,達到更高的泛化性能;高效樣本篩選能力,可以海量無標注樣本篩選,節省80%以上人力標注代價;小樣本/零樣本能力,自動化數據增強,數據挖掘算法,實現零訓練樣本下缺陷樣本識別,較傳統方法發現率提升2-3倍;低門檻AI開發,提供自動化工作流,自動數據處理,自動化調參,自動化生成模型,減少對AI開發工程師專業依賴。
“AI for Industries(工業人工智能)是人工智能新的爆點,盤古行業大模型正在加速落地,賦能千行百業智能升級?!碧锲娣Q。
責編:彭勃
校對:王蔚