商湯科技推出大語言模型“商量SenseChat”
2023年4月10日,商湯科技舉辦技術(shù)交流日活動,分享了以“大模型+大算力”推進AGI(通用人工智能)發(fā)展的戰(zhàn)略布局,并公布了商湯在該戰(zhàn)略下的“日日新SenseNova”大模型體系,推出自然語言處理、內(nèi)容生成、自動化數(shù)據(jù)標注、自定義模型訓練等多種大模型及能力。
其中,商湯最新研發(fā)的大語言模型被命名為“商量SenseChat”。
作為千億級參數(shù)的自然語言處理模型,“商量SenseChat”在活動現(xiàn)場展示了多輪對話和超長文本的理解能力。商湯也展示了語言大模型支持的幾項創(chuàng)新應用,包括:編程助手,可幫助開發(fā)者更高效地編寫和調(diào)試代碼;健康咨詢助手,為用戶提供個性化的醫(yī)療建議;PDF文件閱讀助手,能輕松從復雜文檔中提取和概括信息。
商湯科技董事長兼CEO徐立表示:“在AI大模型時代,數(shù)據(jù)、算法和算力這三要素也在經(jīng)歷新的演變,大模型參數(shù)量將以指數(shù)級的速率提升,而數(shù)據(jù)量隨著多模態(tài)的引入也將大規(guī)模增長,因此就必然會導致對算力需求的劇增。我們以AI大裝置SenseCore打造AGI時代的基礎(chǔ)設(shè)施,并基于此將大模型體系命名為‘日日新SenseNova’,寓意‘茍日新、日日新、又日新’,希望在模型的迭代速度及處理問題的能力上可以日日更新,不斷解鎖AGI的更多可能。”
活動上,商湯不僅展示了“日日新SenseNova”大模型體系下的語言大模型,還展示了AI文生圖創(chuàng)作、2D/3D數(shù)字人生成、大場景/小物體生成等一系列生成式AI模型及應用,并公布了商湯依托AI大裝置SenseCore實現(xiàn)“大模型+大算力”融合創(chuàng)新的研發(fā)體系。
商湯展示了“日日新SenseNova”的各種AI文生圖創(chuàng)作、2D/3D數(shù)字人生成、大場景/小物體生成等一系列生成式AI模型及應用,其中“秒畫SenseMirage”文生圖創(chuàng)作平臺,展現(xiàn)了光影真實、細節(jié)豐富、風格多變的強大的文生圖能力,可支持6K高清圖的生成;客戶還可根據(jù)自身需求訓練生成模型。
“如影SenseAvatar”AI數(shù)字人視頻生成平臺,僅需一段5分鐘的真人視頻素材,就可以生成出來聲音及動作自然、口型準確、多語種精通的數(shù)字人分身。
“瓊宇SenseSpace”和“格物SenseThings”3D內(nèi)容生成平臺,可以高效低成本生成大規(guī)模三維場景和精細化的物件,為元宇宙、虛實融合應用打開新的想象空間。
無論是語言大模型,還是文生圖或數(shù)字人生成,都離不開大規(guī)模AI基礎(chǔ)設(shè)施的算力支持。目前,SenseCore大裝置最多可支持20個千億參數(shù)量大模型同時訓練,最高可支持萬億參數(shù)超大模型的訓練;已支持超過10個大模型訓練項目,為8個客戶提供了大模型訓練服務。
“AGI催生了新的研究范式,即基于一個強大的多模態(tài)基模型,通過強化學習和人類反饋不斷解鎖基模型新的能力,從而更高效地解決海量的開放式任務。AGI將實現(xiàn)從‘數(shù)據(jù)飛輪’到‘智慧飛輪’的演進,最終邁向人機共智?!鄙虦萍悸?lián)合創(chuàng)始人、首席科學家王曉剛表示。
猜你喜歡
商湯科技推出大語言模型“商量SenseChat”
“商量SenseChat”在活動現(xiàn)場展示了多輪對話和超長文本的理解能力。