要聞

工作原理嚴格保密！OpenAI“草莓”項目曝光，推理能力接近人類？內(nèi)部人士曾警告：可能威脅全人類

每日經(jīng)濟新聞 2024-07-13 13:56:34

每經(jīng)編輯｜孫志成杜宇

新近消息顯示，OpenAI正在讓人工智能（AI）大模型的能力更加接近類人的推理水平。

據(jù)知情人士和媒體查閱的內(nèi)部文件，ChatGPT開發(fā)商OpenAI正在一個代號為“草莓”的項目中開發(fā)一種新的人工智能模型。該項目的細節(jié)此前從未被報道過，目前該公司正在努力展示其提供的模型類型能夠提供高級推理能力。這位知情人士說，即使在OpenAI內(nèi)部，“草莓”的工作原理也是一個嚴格保密的秘密。

知情人士還透露，該內(nèi)部文件描述了一個使用Strawberry模型的項目，目的是使該公司的人工智能不僅能夠生成查詢的答案，而且能夠提前做好足夠的計劃，自主、可靠地在互聯(lián)網(wǎng)上導航，以執(zhí)行OpenAI所說的“深度研究”。

CFF20LXzkOwy1K59ibfpWGHnIlAd2CaFqEO1dMHC44adMkaSD0XicA0MQvgqvROOY6jpHIhbnv0aMBtI6NumAr0g.jpg

圖片來源：視覺中國-VCG31N2008743681

OpenAI被問及上述所說的草莓技術(shù)時，OpenAI的發(fā)言人在一份聲明中表示：“我們希望自身AI 模型能夠像我們（人類）一樣看待和理解世界。持續(xù)研究新的AI能力是業(yè)界的常見做法，大家都相信這些系統(tǒng)的推理能力會隨著時間的推移而提高?！?/span>

雖然該發(fā)言人未直接回答有關(guān)草莓的問題，但媒體稱，草莓項目此前名為Q*。而Q*正是去年被爆出OpenAI CEO突然被解雇宮斗大戲的導火索。

去年11月媒體稱，OpenAI代號Q*的項目實現(xiàn)重大突破，讓人類實現(xiàn)通用人工智能（AGI）的步伐大大提速，但OpenAI CEO 奧特曼可能沒有和董事會詳細披露Q*的進展，這是董事會突然解雇奧特曼的一個原因。OpenAI的內(nèi)部人士向董事會致信警告，Q*的重大發(fā)現(xiàn)可能威脅全人類。

媒體稱，Q*可能具備GPT-4所不具備的基礎(chǔ)數(shù)學能力，或許意味著與人類智能相媲美的推理能力，網(wǎng)友推測，這可能代表OpenAI朝著其設(shè)定的AGI目標邁出了一大步。

今年3月曝光的一份文件顯示，OpenAI計劃，在2027年以前，開發(fā)出人類水平的AGI。OpenAI 2022年就開始訓練一個125萬億參數(shù)的多模態(tài)模型，該模型名為Arrakis或Q*，原本計劃在2025年作為GPT-5發(fā)布，但因推理成本高而取消。OpenAI此后計劃，2027年發(fā)布的Q 2025（GPT-8）將實現(xiàn)完全的AGI。

人工智能（AI）研究者早就在爭論用什么標準判斷人類實現(xiàn)了通用人工智能（AGI）。OpenAI最近開發(fā)了一套系統(tǒng)，“自定義”AI進化等級，以此追蹤開發(fā)人類級別AI的進展。

美東時間7月11日周四，OpenAI的發(fā)言人稱，OpenAI在本周二的公司全體會議上與員工分享了新的分類系統(tǒng)，計劃與投資者和公司外部人士分享這些等級的信息。

OpenAI的系統(tǒng)劃分了五個AI水平，按一到五的數(shù)字由低到高排列等級。OpenAI的高管告訴員工，公司認為目前自身產(chǎn)品處于第一級，但即將達到第二級，也就是，可以完成基本問題解決任務(wù)的系統(tǒng)，類似于擁有博士學位但無法使用任何工具的人。

7月11日OpenAI的發(fā)言人表示，OpenAI一直在內(nèi)部測試新功能，這是業(yè)內(nèi)的常見做法。

對于OpenAI開發(fā)AI分級系統(tǒng)的消息，有網(wǎng)友表示，擔心AI超越人類可能帶來的風險，不知道那對經(jīng)濟和就業(yè)有何影響。

今年5月，OpenAI發(fā)布新旗艦AI模型GPT-4o。它面向所有用戶、包括免費用戶，最快232毫秒響應(yīng)音頻輸入，平均響應(yīng)時間和人類相似；相比GPT-4 Turbo速度快兩倍，成本降低50%，API速率限制提高五倍。

上月傳出GPT-5可能大幅推遲上線的消息。OpenAI首席技術(shù)官Mira Murati稱，GPT-5有望在2025年底或2026年初推出。這一發(fā)布時間與早期傳聞有較大出入，市場曾預測GPT-5可能在2023年底或2024年夏季發(fā)布，

不過，Murati透露GPT-5的性能將迎來重大飛躍，在特定任務(wù)中達到博士級智能水平。據(jù)悉，GPT-5內(nèi)部代號為“Gobi”和“Arrakis”，是一個具有52萬億參數(shù)的多模態(tài)模型，上一代GPT-4參數(shù)約為2萬億。這一龐大的參數(shù)規(guī)模暗示了其潛在的強大能力。

Murati將GPT-4到GPT-5的進步比作從高中水平到大學水平的跨越，表明新模型在復雜性和能力上將有顯著提升。

美東時間6月27日，OpenAI公布，其研究人員訓練了一個基于GPT-4的模型，它被稱為CriticGPT，用于捕捉ChatGPT代碼輸出中的錯誤。簡單來說就是，CriticGPT讓人能用GPT-4查找GPT-4的錯誤。它可以寫出使用者對ChatGPT響應(yīng)結(jié)果的批評評論，從而幫助人類訓練者在RLHF期間發(fā)現(xiàn)錯誤。

OpenAI發(fā)現(xiàn)，如果通過CriticGPT獲得幫助審查ChatGPT編寫的代碼，人類訓練師的審查效果比沒有獲得幫助的人強60%。OpenAI稱，正著手將類似CriticGPT的模型集成到旗下RLHF標記管道中，為自己的訓練師提供明確的AI幫助。

OpenAI稱，因為沒有更好的工具，所以人們目前難以評估高級的AI系統(tǒng)的表現(xiàn)。而CriticGPT意味著，OpenAI向能夠評估高級AI系統(tǒng)輸出的目標邁進了一步。

（文章內(nèi)容、數(shù)據(jù)僅供參考，不構(gòu)成投資建議。投資者據(jù)此操作，風險自擔。）

編輯|孫志成?杜宇?杜恒峰

校對|劉小英