国产成人精品免费视,91天堂嫩模在线播放,国产免费小视频在线观看,久久免费公开视频,国产成人精品免费视频网页大全,日韩不卡在线视频,视频一区二区精品的福利

每日經(jīng)濟(jì)新聞
要聞

每經(jīng)網(wǎng)首頁 > 要聞 > 正文

o1如何做到像人一樣“推理”?OpenAI研究團(tuán)隊(duì)問答:揭秘模型細(xì)節(jié)、未來規(guī)劃,還有最大化o1性能的小竅門

每日經(jīng)濟(jì)新聞 2024-09-14 22:11:51

每經(jīng)編輯 張錦河    每經(jīng)實(shí)習(xí)編輯 宋欣悅    

9月13日,OpenAI宣布了o1系列模型的正式亮相,標(biāo)志著AI領(lǐng)域邁入了一個(gè)全新的紀(jì)元,迎來了能夠執(zhí)行通用復(fù)雜推理任務(wù)的大模型時(shí)代。模型發(fā)布后,OpenAI研究團(tuán)隊(duì)在X社交平臺(tái)上舉辦了一場AMA(Ask Me Anything)活動(dòng),深度揭秘了o1系列模型的諸多細(xì)節(jié)。

圖片來源:X社交平臺(tái)
  • “外星人”級(jí)別的AI助手

OpenAI表示,o1系列包括兩個(gè)版本:作為完整模型早期迭代的o1-preview,以及速度更快的輕量級(jí)o1-mini。與之前的模型不同,o1能夠在給出最終答案前生成長鏈的隱藏思維過程,展現(xiàn)了類似人類的推理能力。研究人員將o1比喻為擁有超能力的“外星人”

圖片來源:X社交平臺(tái)

在推理過程中,o1使用了強(qiáng)化學(xué)習(xí)來實(shí)現(xiàn)“推理”這一性能。盡管目前沒有計(jì)劃向API用戶或ChatGPT展示這些思維鏈token,但研究人員透露,嵌入提示中的指令可以影響o1的思維方式。相比之下,GPT-4o無法通過提示達(dá)到o1的思維鏈性能水平。



圖片來源:X社交平臺(tái)

o1系列模型使用與GPT-4o相同的分詞器,在輸入token上保持一致。不過,o1能夠處理更長、更開放的任務(wù),減少了對(duì)輸入分塊的需求。未來,o1還將支持更大的輸入上下文窗口。

o1還展現(xiàn)了令人印象深刻的推理和泛化能力,例如破譯密碼、思考哲學(xué)問題以及通過自我測驗(yàn)來評(píng)估自身能力。

研究團(tuán)隊(duì)還透露,o1-preview在某些個(gè)性化寫作任務(wù)上的表現(xiàn)與GPT-4o相當(dāng)或略勝一籌。

  • mini版本竟然更強(qiáng)?

與o1-preview相比,o1-mini在體積和速度上進(jìn)行了優(yōu)化。

圖片來源:X社交平臺(tái)

盡管在像世界知識(shí)這樣的某些領(lǐng)域可能有局限,但o1-mini在STEM(科學(xué)、技術(shù)、工程、數(shù)學(xué))任務(wù)以及代碼相關(guān)任務(wù)上展現(xiàn)出了其優(yōu)勢。此外,o1-mini能夠探索比o1-preview更多的思維鏈



圖片來源:X社交平臺(tái)
  • o1即將支持工具集成與多模態(tài)理解

盡管o1-preview目前尚未使用工具,但OpenAI計(jì)劃為其加入功能調(diào)用、代碼解釋器和網(wǎng)頁瀏覽等能力。工具支持、結(jié)構(gòu)化輸出和系統(tǒng)提示也將在未來的更新中推出

圖片來源:X社交平臺(tái)

此外,OpenAI開發(fā)者團(tuán)隊(duì)表示,未來用戶將有望能夠控制o1的思考時(shí)間以及token限制,并承諾將積極推進(jìn)這一功能的實(shí)現(xiàn)。

OpenAI還在積極推進(jìn)流式傳輸支持和API中的推理進(jìn)度反饋。此外,o1已經(jīng)內(nèi)置了多模態(tài)能力,有望在多模態(tài)理解任務(wù)(MMLU)上達(dá)到最先進(jìn)的水平。



圖片來源:X社交平臺(tái)
  • o1-mini每周有50次提示限制

o1-mini目前對(duì)ChatGPT Plus用戶開放,但有每周50次的提示限制,所有提示都計(jì)入相同的配額。OpenAI承諾,未來將逐步提高API訪問級(jí)別和速率限制,并在限制放寬后提供批量定價(jià)優(yōu)惠

o1模型的定價(jià)預(yù)計(jì)將遵循每1-2年降價(jià)的趨勢。此外,個(gè)性化微調(diào)支持已在產(chǎn)品路線圖中,但具體發(fā)布時(shí)間表尚不明確。



圖片來源:X社交平臺(tái)
  • 最大化o1性能的秘訣

o1-mini目前使用截至2023年10月的數(shù)據(jù)進(jìn)行訓(xùn)練,未來的迭代將使用更新的數(shù)據(jù)集來擴(kuò)充其世界知識(shí)。

為了充分發(fā)揮o1的推理優(yōu)勢,團(tuán)隊(duì)建議用戶在設(shè)計(jì)提示時(shí)提供信息豐富、涵蓋邊緣案例的具體示例,并明確指定所需的推理步驟和風(fēng)格。但要注意,無關(guān)的上下文可能會(huì)干擾模型的推理過程。

每日經(jīng)濟(jì)新聞綜合自公開消息

如需轉(zhuǎn)載請(qǐng)與《每日經(jīng)濟(jì)新聞》報(bào)社聯(lián)系。
未經(jīng)《每日經(jīng)濟(jì)新聞》報(bào)社授權(quán),嚴(yán)禁轉(zhuǎn)載或鏡像,違者必究。

讀者熱線:4008890008

特別提醒:如果我們使用了您的圖片,請(qǐng)作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站,可聯(lián)系我們要求撤下您的作品。

Ai 社交平臺(tái) OpenAI

歡迎關(guān)注每日經(jīng)濟(jì)新聞APP

每經(jīng)經(jīng)濟(jì)新聞官方APP

0

0