2023-07-08 19:09:21
每經(jīng)AI快訊,7月8日,由上海數(shù)據(jù)交易所、大數(shù)據(jù)流通與交易技術(shù)國家工程實驗室承辦的“大模型時代下的數(shù)據(jù)要素流通”主題論壇在上海世博中心舉行。上海數(shù)交所總經(jīng)理湯奇峰作題為“大模型時代下的語料庫”的主旨演講,帶來關(guān)于國內(nèi)語料庫建設(shè)挑戰(zhàn)的觀察,并從語料庫質(zhì)量和開放程度兩個維度給出建設(shè)建議。湯奇峰認(rèn)為,大模型時代下的語料庫建設(shè)存在語料庫供給不足、語料庫質(zhì)量不高、語料庫多樣性匱乏、語料庫標(biāo)準(zhǔn)欠缺等問題。“語料庫建設(shè)不是單一企業(yè)的責(zé)任,需要多方共同推進(jìn),如果每個企業(yè)都單獨建設(shè)維護(hù)語料庫,會拉低效率,也會增加企業(yè)成本,數(shù)交所希望通過自己的努力加強(qiáng)數(shù)據(jù)要素建設(shè)提升語料庫建設(shè)效率。”湯奇峰表示,“語料庫采購已經(jīng)在不少大模型企業(yè)成本中占據(jù)重要比重,上海數(shù)交所希望以市場配置的方式組織數(shù)據(jù)要素推動語料庫建設(shè)。”上海數(shù)交所官網(wǎng)已經(jīng)于7月7日正式上線語料庫,累計掛牌近30個語料數(shù)據(jù)產(chǎn)品,包含文本、音頻、圖像等多模態(tài),覆蓋金融、交通運(yùn)輸和醫(yī)療等領(lǐng)域。(中證網(wǎng))
特別提醒:如果我們使用了您的圖片,請作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站,可聯(lián)系我們要求撤下您的作品。
歡迎關(guān)注每日經(jīng)濟(jì)新聞APP