中央政法委機關報法治日報社主辦

您所在的位置:首頁  > 互聯網事

百“?!贝髴?zhàn)將走向何方

2023-07-27 12:33:40 來源:法治日報·法治周末


“大模型在各個行業(yè)深入推進展現出了非常強勁的勢頭,大家對它期待也非常高,希望其能夠成為行業(yè)智能化發(fā)展的引擎,成為未來智慧的底座” 

《法治周末》記者 王京仔

“我國大模型驅動產業(yè)加速,高校和頭部企業(yè)積極研發(fā)大模型技術,國產大模型已超80個。”近日,由中國互聯網協會發(fā)布的《中國互聯網發(fā)展報告(2023)》顯示。

今年,大模型成為全球人工智能發(fā)展的焦點和產業(yè)各方熱點話題,越來越多的公司和組織開始投入大量的人力、物力和財力來研究和開發(fā)大模型。以ChatGPT為代表的通用大模型正成為通用人工智能的橋梁和技術躍升的新途徑,驅動著社會各行業(yè)生產力、生產效率發(fā)生巨大的變化,也帶動了各領域的行業(yè)大模型如火如荼地發(fā)展。

大模型時代,大模型如何賦能各行各業(yè)?通用大模型、行業(yè)大模型有著怎樣的發(fā)展路徑?未來面臨哪些機遇和挑戰(zhàn)?在7月20日舉行的2023(第二十二屆)中國互聯網大會“大模型的發(fā)展路徑”論壇上,行業(yè)學者、企業(yè)代表等就此展開了討論。

通用大模型是行業(yè)大模型重要的基礎

2022年11月,ChatGPT一經推出便掀起大模型發(fā)展的熱潮。大模型技術與AI產業(yè)發(fā)展日新月異,AI引領的新一輪科技革命正加速演進,僅在國內,迄今已有80余個大模型公開發(fā)布。

在與會的專家們看來,在大模型時代中,通用大模型、行業(yè)大模型已經成為大模型的兩個方向。在產業(yè)各方的共同努力下,我國已形成初步的大模型產業(yè)鏈條,通用大模型與行業(yè)大模型將協同發(fā)展,共同推進產業(yè)滲透。行業(yè)大模型將基于更智能的通用大模型的平臺底座,更好地為千行百業(yè)服務。

“大模型在各個行業(yè)深入推進展現出了非常強勁的勢頭,大家對它期待也非常高,希望其能夠成為行業(yè)智能化發(fā)展的引擎,成為未來智慧的底座。”中國信息通信研究院云計算與大數據研究所副所長魏凱坦言,希望與大家交流、未來展開更多合作,目的就是讓大模型能夠真正地走向千行百業(yè),扎下根,真正為我們國家數字化轉型更好地賦能。

關于未來的大模型發(fā)展路徑,魏凱表示,一個路徑是從基礎模型到行業(yè)模型的路徑,第二個是模型即服務的發(fā)展。具體而言,愿意掏錢的還是在行業(yè),從通用轉向行業(yè)是一個趨勢,解決行業(yè)生產力的問題;未來可能是大模型驅動小模型,模型即服務可能是相互嵌套的,一個模型調用另用一個模型,把這些模型縫合、串聯、并聯起來完成一個復雜的場景具體任務。

在北京智源人工智能研究院副院長、總工程師林詠華看來,通用大模型是行業(yè)大模型重要的基礎。首先,通用大模型是知識體系的基礎,不能強求通用大模型里面包含所有行業(yè)的專業(yè)知識,但很多領域的基本知識是希望包括的,如果在通用大模型的預訓練中沒有見過相關數據,就需要依靠行業(yè)大模型做大量微調。其次,通用大模型或者基礎模型是下游行業(yè)模型很重要的底座和框架。同時,通用模型自身發(fā)展需要與行業(yè)模型進行相輔相成的配對或者迭代。

中國信息通信研究院云計算與大數據研究所人工智能部主任曹峰補充說明,他認為通用大模型未來可能呈現“聚合”,因為考慮算力能力、數據集的獲取等,需要聚合更多的算力資源、更多行業(yè)專家的能力,“聚合的目的是為了形成更重要、更好用或能力更強的基礎大模型”。行業(yè)大模型的發(fā)展趨勢,則是在找到更多場景基礎上更多地形成新的應用模式。

通用大模型應建立開源開放生態(tài)

“我們今天所說的大模型,是通用性人工智能到真正的超人智能之間的一個過渡階段。”北京智源人工智能研究院院長、北京大學計算機學院教授黃鐵軍指出,“通用人工智能”往往對應GAI(General Artificial Intelligence)和AGI(Artificial General Intelligence)兩個概念。GAI是指具有通用性的人工智能,強調的是通用性,即人工智能大模型并不限于專門的問題或領域;AGI嚴格意義上叫做人工通用智能,強調的是在人類智能所有方面全面超越人類的一種人工智能。

黃鐵軍表示,像ChatGPT這樣一個大語言模型是把人類的所有語言,主要是書面語言,訓練成一個千億、萬億的神經網絡,從而具備了融會貫通的能力。不同于傳統IT系統的確定性,“從某種意義上講,這種模型背后有其自己對世界模型空間的認知”。大模型可能兩三年就能把人類所有的資料都拿來訓練,相較之下,每個人的知識空間與它相比都是微不足道的,這方面它是超人的,而未來大模型發(fā)展到具備其他超人能力都是可能的,如發(fā)現新的物理定律等。

在黃鐵軍看來,目前我國大模型發(fā)展的問題在于從“大煉模型”變成“大煉大模型”,碎片化嚴重,造成資源浪費?!按竽P瓦@件事要體系化地去做,特別是一定要把大模型競爭從模型本身給拉回到算法競爭、技術競爭上去,不能僅僅停留在誰能做出一個大模型?!彼麖娬{,大模型要比的是聰明程度、智力程度,一旦出現了“最強”的智能系統,訓練那么多“智力不高”的系統就沒有意義了。

華為戰(zhàn)略研究院大模型產業(yè)發(fā)展首席專家王震軍表示,真正的預訓練通用大模型對數據、算力、先進算法架構等要求都非常高,未來成為一個人工智能或整個信息領域的操作系統,一定是在大廠之間最終勝出兩三家。林詠華也認為算力、人力、數據能力奠定了大模型很重要的基礎,通用大模型的錘煉不能僅跟著某一個商業(yè)利益走偏,而是朝著今天的OpenAI那樣走到它的層面,“大家都希望中國能夠有一家到三家機構達到那個層面,而且必須要有這樣的機構,這需要集合大家的智慧和力量去做”。

針對我國當前通用大模型研發(fā)應用現狀,黃鐵軍認為,對中國而言,很多企業(yè)機構都能訓大模型,關鍵在于大家要通過開源方式聯合迭代創(chuàng)新,推動行業(yè)發(fā)展往前走?!皬募夹g體系演進來看,英特爾聯盟在技術上主導了PC時代,移動互聯網時代iOS和Android兩個生態(tài)主導了迄今為止手機的生態(tài)。進入智能時代,這樣的生態(tài)也一定會出現,且正在出現?!彼麖娬{,要建立開源開放的生態(tài)。

近日,Meta公布最新大語言模型Llama2并宣布開源,覆蓋70億、130億及700億參數版本,可免費用于商業(yè)或者研究。7月25日,阿里云在國內推出針對Llama2全系列版本的訓練和部署方案,便于開發(fā)者進行再訓練,搭建專屬大模型。

大模型落地行業(yè)需解決專業(yè)知識、安全等問題

通用人工智能搭建后需要落地行業(yè),現階段,大模型賦能各行各業(yè)還面臨哪些挑戰(zhàn)呢?

“大模型重塑產業(yè)格局,兩年落地50%+行業(yè)核心場景,華為云在金融、制造、政務、氣象、鐵路等領域推動了深入的行業(yè)創(chuàng)新。”華為云大數據與AI總經理李偉指出,在實踐過程中,發(fā)現通用大模型落地行業(yè)的時候存在三個挑戰(zhàn)。

具體而言,一是大模型通用性強,但專業(yè)能力是比較弱,落地行業(yè)需要具備專業(yè)知識,明白行業(yè)工作流程,給出專業(yè)準確的回答;二是大模型知識雖然多,但技能不足,目前通用大模型大多展現的是大語言模型,而企業(yè)場景本身是很復雜的,需要的模型不僅能說還要會看,不僅能想還要會算;三是數據的安全合規(guī)問題,數據是企業(yè)核心資產之一,大模型可以有效地存儲和挖掘知識,但訓練和使用大模型需要保障企業(yè)數據安全合規(guī)。

李偉以華為云盤古大模型為例,介紹了實現行業(yè)大模型采用的四大關鍵舉措,包括沉淀行業(yè)知識、淬煉行業(yè)技能、對話專業(yè)工具、保障安全合規(guī)等。

“從長期發(fā)展來看,應該把數據做大、把數據質量做高、把模型做小,有助于大模型規(guī)?;穆涞?;在使用模型上,應該用最小成本的方式去使用,即優(yōu)先通過parameter,其次是通過SFT的方式去使用模型;要累積應用場景和數據,有助于使用方下一步真正啟用大模型?!卑⒗镞_摩院資深技術專家王巍巍強調,大模型落地時,場景非常關鍵。在推進大模型落地過程中一定要找準場景,弄清楚大模型能解決哪些問題,哪些問題解決不好,能解決好的問題怎么去解決等,隨著國內大模型的發(fā)展,今后應該可以在多個維度上用一個模型來解決不同場景落地的問題。同時,他指出,我國的行業(yè)模型發(fā)展還需要走更長一段路。

魏凱則指出,大模型進入千行百業(yè)的兩個核心是工程化和安全可信。大模型本身有理論上的創(chuàng)新,更有工程的創(chuàng)新,大模型落地到行業(yè)里,工程化實施的能力非常重要,這些模型的服務商、模型技術提供商需要把技術棧封裝起來,不讓用戶直面復雜的技術棧。很多公司采取措施強制禁用ChatGPT等大模型,主要原因就是一些非常嚴重的數據安全風險及模型本身提示工程投毒風險,還有輸出結果穩(wěn)定性、可靠性、透明度等。面對日漸凸顯的大模型安全可信風險,一個路徑就是需要技術與管理雙管齊下,保證模型的安全可信,中國信息通信研究院面向大模型“建、用、管”等產業(yè)需求,形成覆蓋大模型全生命周期的《大模型技術和應用評估方法》系列標準,面向產業(yè)提供評測服務,助推大模型生態(tài)可信發(fā)展。

從行業(yè)大模型層面,哪些行業(yè)會率先使得行業(yè)大模型落地,王震軍認為具有三個方面的共性:一是行業(yè)體量比較大,無論是市場空間還是用戶數;二是行業(yè)信息化程度比較高,包括數據化能力、技術等;三是行業(yè)容錯率比較低,如文創(chuàng)、娛樂、教育等。

“目前階段,通用大模型和行業(yè)大模型可以適當做一些解耦。通用大模型的世界格局已經比較清楚,但國內格局仍不是特別清楚,同時在行業(yè)大模型里,做好行業(yè)應用場景、具體某一領域的Know-How能力是促進行業(yè)發(fā)展都需要做的,可以把這部分工作先做了,到時候具體結合哪個通用大模型來進一步提升,可以有多種路線選擇?!蓖跽疖娧a充。

責編:肖莎

聯系我們 | 誠聘英才 | 廣告征訂 | 本站公告 | 法律聲明 | 報紙訂閱

版權所有 Copyrights ? 2014-2023 helpmore.com.cn ALL RIGHTS Reserved 《法治周末》

京ICP備10019071號-1 京報出證字第0143號

京公網安備 11010502038778號