本報記者 劉釗 見習記者 熊悅
近期,ChatGPT火爆網絡,引發各大公司搶灘新興賽道,國內類ChatGPT模型的技術進展及產品發布也備受關注。
(相關資料圖)
2月20日,復旦大學自然語言處理實驗室邱錫鵬教授團隊發布了國內對話式大型語言模型。該模型以大熱電影《流浪地球》中超級量子計算機“MOSS”命名,目前已處于內測階段。2月21日當天,與MOSS有關的多個話題沖上微博熱搜,網民討論熱烈。
受上述消息影響,今日早盤,復旦復華一字漲停。截至收盤,報6.78元/股,漲停板上封單超11萬手。
對于股價漲停,復旦復華回應市場關切表示,“MOSS為復旦大學研發,與本公司無關。目前公司的主營業務為生物醫藥、軟件和園區三大板塊,未參與MOSS研發。”
相關概念股熱度大漲
上述內測平臺一經公開便引發大量用戶嘗試,據多位用戶向《證券日報》記者反映,2月21日當天系統一度無法登錄。復旦大學自然語言處理實驗室也公開回應稱,“MOSS還是一個非常不成熟的模型,距離ChatGPT還有很長的路需要走。MOSS只是想在百億規模參數上探索和驗證ChatGPT的技術路線,并且實現各種對話能力。”
作為國內自研類ChatGPT嘗試,有關該模型的諸多技術細節有待公開。不過資本市場上,相關概念股再度“狂歡”。受上述消息影響,今日早盤,復旦復華一字漲停。截至收盤,報6.78元/股,漲停板上封單超11萬手。此外,恒寶股份漲停,云從科技漲超5%,鴻博股份漲近5%,神州數碼、金財互聯、三六零、中科金財等跟漲。
此外,“MOSS”相關商標也出現搶注現象。某企業查詢平臺顯示,目前MOSS商標申請信息共74條,已有32個商標被成功注冊,申請人包括進出口、電子商務、高新技術等領域的多家公司及多個自然人,商標國際分類包括科學儀器、珠寶鐘表、教育娛樂等。此外,目前仍有3個MOSS商標正在注冊申請中。
中國版ChatGPT問世?
據邱錫鵬介紹,MOSS是一個像ChatGPT一樣的對話語言模型,能夠按照用戶的指令執行各種自然語言任務,包括回答問題、生成文本、總結文本、生成代碼等。其開發的基本步驟包括自然語言模型的基座訓練、理解人類意圖的對話能力訓練兩個階段。
在對話能力訓練階段,OpenAI收集數十萬條人類指令,讓專業標注員寫出指令回復,并將其輸入模型基座,以幫助ChatGPT逐步理解各種指令。復旦團隊則采用不同的技術路線,讓MOSS和人類以及其他對話模型都進行交互,從而顯著提升模型的學習效率和研發效率,短時間內完成對話能力訓練。據悉,實驗室將于今年3月份發布MOSS源碼。
那么,這個被外界稱為中國版類ChatGPT的MOSS能否堪比ChatGPT?與后者相比,其優勢和缺陷又有哪些?
邱錫鵬公開表示:“MOSS與ChatGPT的差距主要在自然語言模型基座預訓練這個階段。MOSS的參數量比ChatGPT小一個數量級,在任務完成度和知識儲備量上,還有很大提升空間。”
根據研發團隊成員孫天祥在公開平臺的說法,MOSS參數量為百億級別,因此推理能力、事實性知識不足是難以克服的缺陷,但該缺陷會隨著參數量增長迅速緩解。MOSS中文理解和生成較弱,隨著中文數據的增多,下一版本的MOSS將會大幅度增強。“總體來說,MOSS作為比ChatGPT小一個數量級的模型,能力還落后很多,但不可否認的是MOSS確實具備一定的類似能力,隨著參數和數據增長到類似量級,我個人看好能夠達到ChatGPT水準。”
相關業內人士告訴《證券日報》記者,MOSS的優點在于這個是國內自研的類ChatGPT聊天機器人,在國內NLP自然語言處理以及人工智能領域應該可以起到領頭羊的作用。并且MOSS是開源的,意味著其后模型的源代碼、可能還有論文都會公開,由此吸引更多人才入局,進一步對相關技術的研發起到加速作用。
深度科技研究院院長張孝榮對記者表示,MOSS的出現對于國產機器人技術的發展起到了極好的推動作用。自然語言處理是AI發展的重大難關,盡管ChatGPT獲得了一定進展,但仍然需要眾多機構和資源一起參與,攻克技術難點。當下流行的聊天機器人技術,需要構建巨大語言模型、大算力和大型語料庫。ChatGPT雖然領先,但依然屬于弱人工智能范疇,還在實驗室階段,難以大規模商用。
張孝榮進一步表示,復旦MOSS由于算力不足,剛剛開通測試不到一天,由于訪問壓力過大而服務器崩潰。谷歌聊天機器人在首秀當日翻車,微軟直接引入GPT技術改造搜索引擎招來許多差評。“市場很火爆,但相關技術尚未成熟,投資需謹慎。”
(編輯 喬川川)