要聞

價(jià)格驟降96%~97%！OpenAI“殺入”小模型，GPT-4o mini功能更強(qiáng)、成本更低

每日經(jīng)濟(jì)新聞 2024-07-19 13:14:01

每經(jīng)記者｜蔡鼎每經(jīng)編輯｜程鵬蘭素英

美東時(shí)間7月18日（周四），OpenAI正式推出新一代入門級別人工智能模型“GPT-4o mini”，稱這款新模型是“功能最強(qiáng)、性價(jià)比最高的小參數(shù)模型”，旨在服務(wù)更廣泛的客戶群體。這也意味著開發(fā)人員如今有了一種輕量級且廉價(jià)的工具，讓他們能夠以更低的成本構(gòu)建AI應(yīng)用程序。

外媒報(bào)道中稱，目前，GPT-4o mini模型的應(yīng)用程序編程接口支持文本和視覺，未來將支持文本、圖像、視頻和音頻的輸入和輸出。

更重要的是，最新的“GPT-4o mini”比GPT-4o便宜了96%~97%，比起GPT-3.5 Turbo也要便宜60%~70%。正因如此，隨著GPT-4o mini上架，GPT-3.5 Turbo的歷史使命到此結(jié)束。OpenAI還表示，GPT-4o mini是首個使用其全新安全策略“指令層級”的AI模型。

對于為何未能更早推出“小而精”的AI模型，OpenAI的API產(chǎn)品負(fù)責(zé)人Olivier Godement表示，這純粹是“優(yōu)先級”的問題，而隨著時(shí)間的推移，OpenAI注意到開發(fā)人員越來越渴望使用較小的模型，這也讓公司決定投入資源開發(fā)GPT-4o mini。

GPT-4o mini：比GPT-4o便宜96% 將取代GPT-3.5 Turbo

據(jù)OpenAI，GPT-4o mini的API價(jià)格將會是15美分/100萬Tokens輸入，以及60美分/100萬Tokens輸出。上下文窗口依然是12.8萬個Tokens，知識截止日期為2023年10月。公司拒絕透露新模型的參數(shù)量大小，僅表示與市面上類似的AI小模型（Claude Haiku、 Gemini 1.5 Flash等）處于同一個級別。

作為對比，GPT-4o的百萬Tokens輸入和輸出價(jià)格分別是5美元和15美元，之前的入門款模型GPT-3.5 Turbo定價(jià)分別是0.5美元和1.5美元。這就是說，最新的“迷你模型”的價(jià)格比GPT-4o便宜了96%~97%，比起GPT-3.5 Turbo也要便宜60%~70%。正因如此，隨著GPT-4o mini上架，GPT-3.5 Turbo的歷史使命到此結(jié)束。

根據(jù)Artificial Analysis的統(tǒng)計(jì)，GPT-4o mini已經(jīng)達(dá)到美國AI公司主流“小模型”里面價(jià)格最低的位置，比起Anthropic、谷歌的同類型競品都要便宜一截。

OpenAI稱，最新的GPT-4o mini從周四起向ChatGPT的免費(fèi)用戶以及ChatGPT Plus和ChatGPT Team的訂閱用戶開放，并將在下周向ChatGPT Enterprise用戶開放。GPT-4o mini將取代ChatGPT中的舊模型GPT-3.5 Turbo。

OpenAI表示，GPT-4o mini目前在聊天偏好上表現(xiàn)優(yōu)于GPT-4，在大規(guī)模多任務(wù)語言理解測試（MMLU）中的得分為82%。（注：MMLU是一個文本智能和推理基準(zhǔn)，用于評估語言模型的能力。MMLU分?jǐn)?shù)越高，表明該模型可以更好地理解和使用各種領(lǐng)域的語言，從而增強(qiáng)現(xiàn)實(shí)世界的應(yīng)用。）

CFF20LXzkOyB6UvTOfjJdibNpa5UXbykFHHKtwCNMZmZAcicj6amt0I5Xqvc88WSjic84fJjPNCQtvTNFkvwYibgvw.png

圖片來源：OpenAI官網(wǎng)截圖

而在這項(xiàng)測試中，同為小參數(shù)模型的谷歌Gemini Flash得分為77.9%，Claude Haiku得分為73.8%。在更大參數(shù)的模型中，GPT-3.5在這項(xiàng)測試中的得分為70%，GPT-4o得分為88.7%，谷歌Gemini Ultra據(jù)稱取得了有史以來最高分（90%）。

值得注意的是，研究人員對像MMLU這樣的基準(zhǔn)測試持謹(jǐn)慎態(tài)度，因?yàn)椴煌镜墓芾矸绞铰杂胁煌虼瞬煌Ｐ偷牡梅蛛y以比較。還有一個問題是，模型的數(shù)據(jù)庫中可能有這些答案，也就是說其可以作弊，而且通常沒有第三方評估人員參與這個過程。

CFF20LXzkOwNfsay86cib4p0S2T0NfBIZicSMl7tYnKBaibmLibs8uIQI1mZYasibU5KFf6wlMM5EENdMic3ibFTHCmUw.png

入局小模型的背后

外媒報(bào)道中稱，GPT-4o mini的推出也是OpenAI推動“多模態(tài)”（multimodality）技術(shù)發(fā)展努力的一部分，多模態(tài)指的是在一個大模型中提供多種類型的AI生成媒體，如文本、圖像、音頻和視頻。

不僅如此，這一全新小模型也承載著幫助OpenAI走入更廣泛的客戶群體的希望。OpenAI在今年早些時(shí)候的最新一輪融資過后，估值已經(jīng)超過800以美元。雖然是全球生成式AI估值最高的獨(dú)角獸，但OpenAI仍面臨著壓力：一方面要保持其在生成式AI市場的領(lǐng)先地位，另一方面，由于其在AI基礎(chǔ)設(shè)施上投入了大量資金以構(gòu)建和訓(xùn)練模型，因此還要想方設(shè)法盈利。

CFF20LXzkOyB6UvTOfjJdibNpa5UXbykFIyWoeMFBuN5Vy7UB6R9roYTe1Nt6cAMpqBkzktuHHw1ZtVGjagJB1w.png

圖片來源：OpenAI官網(wǎng)截圖

GPT-4o mini為開發(fā)人員提供一種輕量級且廉價(jià)的工具，讓他們能夠開發(fā)出所有的應(yīng)用程序和工具，相對而言，GPT-4這種更大、更昂貴的模型是他們無法負(fù)擔(dān)得起的。此前，許多開發(fā)人員會轉(zhuǎn)向Claude 3 Haiku或Gemini 1.5 Flash，而不是支付運(yùn)行最強(qiáng)大的模型所需的高昂計(jì)算成本。

而且，GPT-4o mini是首個使用OpenAI全新安全策略“指令層級”的AI模型。這種方法的目的是使AI系統(tǒng)優(yōu)先處理某些指令——例如來自公司的指令——以使人們更難讓工具做不該做的事情。

OpenAI的API產(chǎn)品負(fù)責(zé)人Olivier Godement在接受媒體采訪時(shí)解釋了為何該公司未能更早推出“小而精”的AI模型，他說，這純粹是“優(yōu)先級”的問題，因?yàn)镺penAI專注于創(chuàng)建更大、更好的模型，如GPT-4，這需要大量的人力和計(jì)算資源。隨著時(shí)間的推移，OpenAI注意到開發(fā)人員越來越渴望使用較小的模型，因此公司決定現(xiàn)在是投入資源開發(fā)GPT-4o mini的時(shí)機(jī)。

“我們的使命是使最前沿技術(shù)、構(gòu)建最強(qiáng)大、最有用的應(yīng)用程序，我們當(dāng)然希望繼續(xù)做前沿模型，推動技術(shù)進(jìn)步，”OpenAI的API產(chǎn)品負(fù)責(zé)人Olivier Godement在接受媒體采訪時(shí)說。“但我們也希望擁有最好的小模型，我認(rèn)為它會非常受歡迎。”

“我認(rèn)為GPT-4o mini真正體現(xiàn)了OpenAI讓AI更加普及的使命。如果我們希望AI惠及世界的每一個角落，每一個行業(yè)，每一個應(yīng)用，我們必須讓AI更加實(shí)惠。”Godement說道。

目前，金融科技初創(chuàng)公司Ramp已經(jīng)使用GPT-4o mini構(gòu)建了一個工具，可以提取收據(jù)上的費(fèi)用數(shù)據(jù)。用戶無須費(fèi)力地瀏覽文本框，只需上傳一張收據(jù)的圖片，該模型就會進(jìn)行分類。

電子郵件客戶端Superhuman也對GPT-4o mini進(jìn)行了測試，并用它創(chuàng)建了一個自動建議郵件回復(fù)的功能。

記者|蔡鼎

編輯|程鵬蘭素英杜恒峰

校對|何小桃

｜每日經(jīng)濟(jì)新聞 nbdnews 原創(chuàng)文章｜