每日經(jīng)濟新聞 2024-04-16 23:30:56
每經(jīng)記者 楊卉 每經(jīng)編輯 梁梟
來自運營商的大模型正在加速進(jìn)入市場。4月16日,《每日經(jīng)濟新聞》記者從中國電信處獲悉,近日中國電信開源了12B參數(shù)規(guī)模星辰語義大模型TeleChat-12B。相較于1月開源的7B版本,內(nèi)容、性能和應(yīng)用等方面整體效果提升了30%。其中,多輪推理、安全問題等領(lǐng)域提升超40%。另外,據(jù)了解,中國電信將于年內(nèi)開源千億級參數(shù)大模型。
根據(jù)中國電信提供的信息,TeleChat-12B將7B版本1.5T訓(xùn)練數(shù)據(jù)提升至3T,此次開源提供基礎(chǔ)模型以及基于相應(yīng)版本的對話模型,支持傳統(tǒng)的全量參數(shù)更新及LoRA等只更新部分參數(shù)的高效微調(diào)方法;支持Deepspeed微調(diào)、支持int8、int4量化和國產(chǎn)芯片訓(xùn)練推理。中國電信方面表示,星辰語義大模型已應(yīng)用于行文寫作、代碼編程、網(wǎng)絡(luò)故障分析以及經(jīng)營分析等場景。行文寫作方面,平均生成字?jǐn)?shù)超過1500字,有效采納率為85.7%。
同日,記者還從中國移動處獲悉,近日,國家互聯(lián)網(wǎng)信息辦公室發(fā)布第五批境內(nèi)深度合成服務(wù)算法備案信息公告,中國移動客服大模型算法通過服務(wù)提供者備案,標(biāo)志著可正式對外提供生成式人工智能服務(wù),成為央企首個全自研、全備案的行業(yè)大模型。
據(jù)中國移動方面介紹,中國移動客服大模型主要應(yīng)用于面向客戶的意圖識別與多輪應(yīng)答,是以“中國移動九天通用大模型”為底座,應(yīng)用客服領(lǐng)域?qū)I(yè)數(shù)據(jù)訓(xùn)練的客服行業(yè)專業(yè)大模型,具備百億參數(shù)大模型的通用交互能力和覆蓋中國移動全業(yè)務(wù)的專業(yè)客服能力。
去年以來,運營商切入大模型的意愿已經(jīng)十分明顯。中國電信就在2023年年報中表示,2024年公司將把握以人工智能為代表的新一輪科技革命和產(chǎn)業(yè)變革趨勢;另據(jù)東湖國家自主創(chuàng)新示范區(qū)官方微信公眾號消息,中國移動九天人工智能團隊將于2024年底對標(biāo)GPT-4完成多模態(tài)大模型訓(xùn)練,含8款子平臺、287項核心算法能力、37項規(guī)?;瘧?yīng)用,提供從智算基礎(chǔ)設(shè)施、核心算法能力到智能化應(yīng)用的全棧人工智能服務(wù),可服務(wù)政務(wù)、工業(yè)、教育、醫(yī)療等多個領(lǐng)域。
如需轉(zhuǎn)載請與《每日經(jīng)濟新聞》報社聯(lián)系。
未經(jīng)《每日經(jīng)濟新聞》報社授權(quán),嚴(yán)禁轉(zhuǎn)載或鏡像,違者必究。
讀者熱線:4008890008
特別提醒:如果我們使用了您的圖片,請作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站,可聯(lián)系我們要求撤下您的作品。
歡迎關(guān)注每日經(jīng)濟新聞APP