每日經(jīng)濟(jì)新聞 2024-07-13 13:56:34
每經(jīng)編輯 孫志成 杜宇
新近消息顯示,OpenAI正在讓人工智能(AI)大模型的能力更加接近類人的推理水平。
據(jù)知情人士和媒體查閱的內(nèi)部文件,ChatGPT開發(fā)商OpenAI正在一個(gè)代號(hào)為“草莓”的項(xiàng)目中開發(fā)一種新的人工智能模型。該項(xiàng)目的細(xì)節(jié)此前從未被報(bào)道過(guò),目前該公司正在努力展示其提供的模型類型能夠提供高級(jí)推理能力。這位知情人士說(shuō),即使在OpenAI內(nèi)部,“草莓”的工作原理也是一個(gè)嚴(yán)格保密的秘密。
知情人士還透露,該內(nèi)部文件描述了一個(gè)使用Strawberry模型的項(xiàng)目,目的是使該公司的人工智能不僅能夠生成查詢的答案,而且能夠提前做好足夠的計(jì)劃,自主、可靠地在互聯(lián)網(wǎng)上導(dǎo)航,以執(zhí)行OpenAI所說(shuō)的“深度研究”。
圖片來(lái)源:視覺中國(guó)-VCG31N2008743681
OpenAI被問及上述所說(shuō)的草莓技術(shù)時(shí),OpenAI的發(fā)言人在一份聲明中表示:“我們希望自身AI 模型能夠像我們(人類)一樣看待和理解世界。持續(xù)研究新的AI能力是業(yè)界的常見做法,大家都相信這些系統(tǒng)的推理能力會(huì)隨著時(shí)間的推移而提高。”
雖然該發(fā)言人未直接回答有關(guān)草莓的問題,但媒體稱,草莓項(xiàng)目此前名為Q*。而Q*正是去年被爆出OpenAI CEO突然被解雇宮斗大戲的導(dǎo)火索。
去年11月媒體稱,OpenAI代號(hào)Q*的項(xiàng)目實(shí)現(xiàn)重大突破,讓人類實(shí)現(xiàn)通用人工智能(AGI)的步伐大大提速,但OpenAI CEO 奧特曼可能沒有和董事會(huì)詳細(xì)披露Q*的進(jìn)展,這是董事會(huì)突然解雇奧特曼的一個(gè)原因。OpenAI的內(nèi)部人士向董事會(huì)致信警告,Q*的重大發(fā)現(xiàn)可能威脅全人類。
媒體稱,Q*可能具備GPT-4所不具備的基礎(chǔ)數(shù)學(xué)能力,或許意味著與人類智能相媲美的推理能力,網(wǎng)友推測(cè),這可能代表OpenAI朝著其設(shè)定的AGI目標(biāo)邁出了一大步。
今年3月曝光的一份文件顯示,OpenAI計(jì)劃,在2027年以前,開發(fā)出人類水平的AGI。OpenAI 2022年就開始訓(xùn)練一個(gè)125萬(wàn)億參數(shù)的多模態(tài)模型,該模型名為Arrakis或Q*,原本計(jì)劃在2025年作為GPT-5發(fā)布,但因推理成本高而取消。OpenAI此后計(jì)劃,2027年發(fā)布的Q 2025(GPT-8)將實(shí)現(xiàn)完全的AGI。
人工智能(AI)研究者早就在爭(zhēng)論用什么標(biāo)準(zhǔn)判斷人類實(shí)現(xiàn)了通用人工智能(AGI)。OpenAI最近開發(fā)了一套系統(tǒng),“自定義”AI進(jìn)化等級(jí),以此追蹤開發(fā)人類級(jí)別AI的進(jìn)展。
美東時(shí)間7月11日周四,OpenAI的發(fā)言人稱,OpenAI在本周二的公司全體會(huì)議上與員工分享了新的分類系統(tǒng),計(jì)劃與投資者和公司外部人士分享這些等級(jí)的信息。
OpenAI的系統(tǒng)劃分了五個(gè)AI水平,按一到五的數(shù)字由低到高排列等級(jí)。OpenAI的高管告訴員工,公司認(rèn)為目前自身產(chǎn)品處于第一級(jí),但即將達(dá)到第二級(jí),也就是,可以完成基本問題解決任務(wù)的系統(tǒng),類似于擁有博士學(xué)位但無(wú)法使用任何工具的人。
7月11日OpenAI的發(fā)言人表示,OpenAI一直在內(nèi)部測(cè)試新功能,這是業(yè)內(nèi)的常見做法。
對(duì)于OpenAI開發(fā)AI分級(jí)系統(tǒng)的消息,有網(wǎng)友表示,擔(dān)心AI超越人類可能帶來(lái)的風(fēng)險(xiǎn),不知道那對(duì)經(jīng)濟(jì)和就業(yè)有何影響。
今年5月,OpenAI發(fā)布新旗艦AI模型GPT-4o。它面向所有用戶、包括免費(fèi)用戶,最快232毫秒響應(yīng)音頻輸入,平均響應(yīng)時(shí)間和人類相似;相比GPT-4 Turbo速度快兩倍,成本降低50%,API速率限制提高五倍。
上月傳出GPT-5可能大幅推遲上線的消息。OpenAI首席技術(shù)官M(fèi)ira Murati稱,GPT-5有望在2025年底或2026年初推出。這一發(fā)布時(shí)間與早期傳聞?dòng)休^大出入,市場(chǎng)曾預(yù)測(cè)GPT-5可能在2023年底或2024年夏季發(fā)布,
不過(guò),Murati透露GPT-5的性能將迎來(lái)重大飛躍,在特定任務(wù)中達(dá)到博士級(jí)智能水平。據(jù)悉,GPT-5內(nèi)部代號(hào)為“Gobi”和“Arrakis”,是一個(gè)具有52萬(wàn)億參數(shù)的多模態(tài)模型,上一代GPT-4參數(shù)約為2萬(wàn)億。這一龐大的參數(shù)規(guī)模暗示了其潛在的強(qiáng)大能力。
Murati將GPT-4到GPT-5的進(jìn)步比作從高中水平到大學(xué)水平的跨越,表明新模型在復(fù)雜性和能力上將有顯著提升。
美東時(shí)間6月27日,OpenAI公布,其研究人員訓(xùn)練了一個(gè)基于GPT-4的模型,它被稱為CriticGPT,用于捕捉ChatGPT代碼輸出中的錯(cuò)誤。簡(jiǎn)單來(lái)說(shuō)就是,CriticGPT讓人能用GPT-4查找GPT-4的錯(cuò)誤。它可以寫出使用者對(duì)ChatGPT響應(yīng)結(jié)果的批評(píng)評(píng)論,從而幫助人類訓(xùn)練者在RLHF期間發(fā)現(xiàn)錯(cuò)誤。
OpenAI發(fā)現(xiàn),如果通過(guò)CriticGPT獲得幫助審查ChatGPT編寫的代碼,人類訓(xùn)練師的審查效果比沒有獲得幫助的人強(qiáng)60%。OpenAI稱,正著手將類似CriticGPT的模型集成到旗下RLHF標(biāo)記管道中,為自己的訓(xùn)練師提供明確的AI幫助。
OpenAI稱,因?yàn)闆]有更好的工具,所以人們目前難以評(píng)估高級(jí)的AI系統(tǒng)的表現(xiàn)。而CriticGPT意味著,OpenAI向能夠評(píng)估高級(jí)AI系統(tǒng)輸出的目標(biāo)邁進(jìn)了一步。
(文章內(nèi)容、數(shù)據(jù)僅供參考,不構(gòu)成投資建議。投資者據(jù)此操作,風(fēng)險(xiǎn)自擔(dān)。)
編輯|孫志成?杜宇?杜恒峰
校對(duì)|劉小英
每日經(jīng)濟(jì)新聞綜合公開資料
如需轉(zhuǎn)載請(qǐng)與《每日經(jīng)濟(jì)新聞》報(bào)社聯(lián)系。
未經(jīng)《每日經(jīng)濟(jì)新聞》報(bào)社授權(quán),嚴(yán)禁轉(zhuǎn)載或鏡像,違者必究。
讀者熱線:4008890008
特別提醒:如果我們使用了您的圖片,請(qǐng)作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站,可聯(lián)系我們要求撤下您的作品。
歡迎關(guān)注每日經(jīng)濟(jì)新聞APP