每日經(jīng)濟(jì)新聞 2024-05-16 23:38:58
每經(jīng)記者 可楊 每經(jīng)編輯 張海妮
不是萬眾期待的AI搜索,競(jìng)爭(zhēng)焦點(diǎn)突然轉(zhuǎn)向了AI智能助手。
近期,OpenAI推出了全能模型GPT-4o,它能夠接受多種方式輸入的內(nèi)容并生成相應(yīng)的輸出內(nèi)容,展示了毫秒級(jí)反應(yīng)和多模態(tài)交互的新能力。與此同時(shí),谷歌在其I/O開發(fā)者大會(huì)上展示了其AI助手Astra和旗艦大模型Gemini。
視覺中國圖
一些業(yè)內(nèi)人士認(rèn)為,OpenAI此次并沒有達(dá)到市場(chǎng)預(yù)期的突破,而是將現(xiàn)有的技術(shù)進(jìn)行了整合。此外,谷歌在AI搜索領(lǐng)域的布局和創(chuàng)新,以及其在智能手機(jī)操作系統(tǒng)優(yōu)化上的努力,顯示了其在AI領(lǐng)域的深厚積累和戰(zhàn)略布局。
比賽行至白熱化階段,似乎已經(jīng)告別了單純的技術(shù)競(jìng)爭(zhēng),更是應(yīng)用和用戶體驗(yàn)的競(jìng)爭(zhēng)。當(dāng)影響因素變得復(fù)雜,專注投入大模型前沿的OpenAI還有多大幾率成為贏家?
突襲谷歌,OpenAI先一步公布AI個(gè)人助理
預(yù)想之中圍繞AI搜索的“戰(zhàn)爭(zhēng)”沒有打響,焦點(diǎn)轉(zhuǎn)移到了AI智能助手上。
當(dāng)?shù)貢r(shí)間5月13日,OpenAI在谷歌I/O 開發(fā)者大會(huì)的前一天召開發(fā)布會(huì),發(fā)布了最新產(chǎn)品GPT-4o,“o”即omni,意為“全能”。OpenAI官網(wǎng)介紹,GPT-4o是邁向更自然人機(jī)交互的一步,因?yàn)樗邮芪谋?、音頻和圖像的任意組合作為輸入內(nèi)容,并生成文本、音頻和圖像的任意組合輸出內(nèi)容。
OpenAI首席技術(shù)官米拉·穆拉蒂在發(fā)布會(huì)上表示,GPT-4o的速度比現(xiàn)有的GPT-4 Turbo快了兩倍,但成本僅為其一半。GPT-4o可以實(shí)時(shí)對(duì)文本、音頻和圖像進(jìn)行推理,響應(yīng)時(shí)間幾乎達(dá)到人類水平。
在26分鐘的直播中,GPT-4o展示了其毫秒級(jí)反應(yīng)、識(shí)別人類情緒進(jìn)行音視頻交互,可多模態(tài)輸入/輸出等一系列新能力。與此同時(shí),GPT-4o覆蓋桌面與App且完全免費(fèi)向用戶提供。
而谷歌則在其I/O開發(fā)者大會(huì)上,展示了自身全能的AI能力,在會(huì)上連續(xù)發(fā)布、更新了十多款產(chǎn)品,包括AI助手Astra、文生圖模型Imagen3、對(duì)標(biāo)Sora的文生視頻模型Veo,以及旗艦大模型Gemini。
在谷歌的演示視頻中,使用AI助手Astra時(shí),只要打開手機(jī)攝像頭,對(duì)準(zhǔn)任意物品,AI可以準(zhǔn)確說出物品的名稱。只要將手機(jī)攝像頭對(duì)準(zhǔn)某個(gè)物體,Gemini就可以識(shí)別它,比如一個(gè)紅蘋果,還可以回答諸如“鏡頭中什么東西是可以發(fā)聲的”這種問題。
此外,谷歌方面表示,夏季將擴(kuò)展Gemini的多模態(tài)功能,包括增加用語音進(jìn)行深入雙向?qū)υ挼哪芰?,該功能被稱為Live。通過GeminiLive,用戶可以與Gemini交談,并可以從各種自然的聲音中選擇它回應(yīng)的聲音。用戶甚至可以按照自己的節(jié)奏說話,或者在回答過程中打斷并澄清問題,就像在任何人類對(duì)話中一樣。
據(jù)彭博社報(bào)道,近日,蘋果公司被曝正與OpenAI敲定一項(xiàng)協(xié)議,今年將后者的部分技術(shù)引入iPhone。而在本次發(fā)布會(huì)上,谷歌產(chǎn)品管理副總裁Sameer Samat明確表示,谷歌將通過Gemini進(jìn)一步優(yōu)化安卓操作系統(tǒng)。這種優(yōu)化將首先在谷歌自家手機(jī)Pixel上得到體現(xiàn)。
GPT-5缺席,OpenAI降速?
對(duì)于OpenAI的突襲更新,行業(yè)不再是統(tǒng)一的贊嘆。“發(fā)布會(huì)雖然驚艷,但谷歌看完應(yīng)該是不慌了。”獵豹移動(dòng)董事長兼CEO、獵戶星空董事長傅盛在其個(gè)人微博表示。
在5月14日發(fā)布的短視頻中,傅盛談及“所有國內(nèi)人工智能從業(yè)者都在熬夜等著大洋彼岸放‘核彈’,但是沒想到‘核彈’沒有放,卻掏出了一堆‘摔炮’”。他表示,讓人失望的是這次OpenAI沒有發(fā)布GPT-5.0,連GPT-4.5也沒有看到,反而是發(fā)布了GPT-4o,“就是把一系列的引擎給結(jié)合在一起,比如圖片、文字、聲音,這樣你就不需要來回去切換了”。
不過,傅盛后續(xù)也表示:“OpenAI這次為了能夠讓更多的用戶使用它,可以說是鉚足了勁,一系列的應(yīng)用,API降價(jià),GPT免費(fèi)。我們當(dāng)然希望OpenAI能夠使得這個(gè)行業(yè)更好發(fā)展,我們也能認(rèn)真地去學(xué)習(xí),這次的發(fā)布會(huì)真正告訴我們應(yīng)用大有可為,所有人都應(yīng)該努力。”
“GPT-4o出來,又比原來進(jìn)步一大截,它(OpenAI)每次一升級(jí)就會(huì)‘死’一些公司,這次一些做GPT實(shí)時(shí)語音交互的團(tuán)隊(duì),直接可以宣布解散了。”GPT-4o發(fā)布的第二天,一名大模型行業(yè)創(chuàng)業(yè)者對(duì)《每日經(jīng)濟(jì)新聞》記者感嘆道。
清華大學(xué)新聞學(xué)院元宇宙文化實(shí)驗(yàn)室主任沈陽同樣在第二天試用了GPT-4o,在其發(fā)布的視頻號(hào)中提到,在文生圖層面,GPT-4o在毛發(fā)細(xì)膩度、光影效果等細(xì)節(jié)上更加優(yōu)異。
隨著雙方在智能助手上的對(duì)碰,沈陽認(rèn)為,當(dāng)前的競(jìng)爭(zhēng)格局已經(jīng)更加明晰,谷歌正在進(jìn)一步推其基于Gemini的AI助手,蘋果公司與OpenAI也初步達(dá)成了合作,將在蘋果手機(jī)上搭載ChatGPT。
沈陽表示,以本次發(fā)布會(huì)作為轉(zhuǎn)折點(diǎn),ChatGPT被改造成了靈魂伴侶,所以產(chǎn)業(yè)格局已經(jīng)明晰了,就是蘋果用內(nèi)置的ChatGPT對(duì)抗谷歌Gemini的手機(jī)助手。Meta也將上線基于Llama的手機(jī)助手。對(duì)于產(chǎn)業(yè)來說,AI助手有望從1億量級(jí)的用戶量走向10億量級(jí)。
“GPT-4o,發(fā)布的時(shí)候我覺得它很強(qiáng)大,但如今我覺得谷歌最新的產(chǎn)品也完全把它的這些成績趕上了,我覺得后面OpenAI應(yīng)該更加緊張,因?yàn)閼?yīng)用公司、超級(jí)大平臺(tái)公司全部趕上來了,它的優(yōu)勢(shì)越來越少。”順福資本創(chuàng)始人、行行AI董事長李明順對(duì)《每日經(jīng)濟(jì)新聞》記者表示,目前來看OpenAI的用戶增長已經(jīng)不太明顯,技術(shù)領(lǐng)先和成本優(yōu)勢(shì)都不一定是最佳,與此同時(shí),強(qiáng)應(yīng)用時(shí)代越來越快到來,在這個(gè)背景下,谷歌這次把它所有的應(yīng)用與大模型集合在一起,形成了更強(qiáng)的用戶依存度,還是更勝一籌。
在李明順看來,下個(gè)階段,美國的平臺(tái)應(yīng)用公司,包括微軟、蘋果、戴爾,以及中國的騰訊、字節(jié)、阿里都會(huì)陸續(xù)結(jié)合自身的應(yīng)用與大模型能力,推出超級(jí)應(yīng)用,逐步邁向綜合競(jìng)爭(zhēng)時(shí)代,靠一個(gè)大模型打江山將更難。
搜索之爭(zhēng)未竟,谷歌反“圍剿”OpenAI
吃下巨頭的“蛋糕”沒有那么容易。發(fā)布會(huì)前,市場(chǎng)充斥著OpenAI圍繞搜索布局的煙霧彈,有報(bào)道稱,OpenAI很可能推出基于ChatGPT技術(shù)的新搜索引擎。與此同時(shí),名為“GPTSearch”的網(wǎng)頁已經(jīng)上線,但目前只有會(huì)員才能訪問。知名記者PeteHuang此前發(fā)推特預(yù)告,表示GPTSearch將在5月9日正式上線。
最終在這一輪交手中,谷歌守住了陣地。谷歌首席執(zhí)行官桑達(dá)爾·皮查伊(Sundar Pichai)在演講中提到,Gemini帶來的最令人興奮的變革之一是在Google搜索中,“我們最大的投資和創(chuàng)新領(lǐng)域之一是我們的創(chuàng)始產(chǎn)品——搜索”。
從發(fā)布會(huì)看,谷歌已經(jīng)率先將AI能力與其搜索引擎相結(jié)合。谷歌方面宣布,能夠總結(jié)谷歌搜索引擎結(jié)果的“AI概覽”(AI Over-views)功能,將于本周在美國推出。在這一功能中,谷歌將向用戶展示AI生成的答案。
據(jù)谷歌介紹,AI概覽是為了響應(yīng)較復(fù)雜的搜索,幫助用戶尋求解決方案。例如,當(dāng)人們搜索素食準(zhǔn)備或出行計(jì)劃時(shí),AI提供的答案會(huì)出現(xiàn)在搜索頁面頂部。
谷歌還提升了搜索的視覺功能,支持通過視頻提出問題。在I/O 開發(fā)者大會(huì)上,谷歌演示了當(dāng)面對(duì)唱片機(jī)故障時(shí),用戶可以一邊拍攝視頻一邊提問,通過新搜索得到包括修理步驟和資源在內(nèi)的AI概覽。
盡管在智能助手層面先一步狙擊谷歌新品,但對(duì)于市場(chǎng)期待的搜索產(chǎn)品,這項(xiàng)自GPT-3.5發(fā)布以來就被寄予厚望的革命性功能,卻在一陣又一陣煙霧彈后,依舊未見進(jìn)一步動(dòng)作。在搜索市場(chǎng),谷歌的基本盤依舊穩(wěn)固,與此同時(shí)其全面的AI能力正在對(duì)競(jìng)爭(zhēng)對(duì)手隱隱形成包圍之勢(shì)。
與巨頭爭(zhēng)奪領(lǐng)地的另一面,對(duì)于OpenAI而言,內(nèi)憂隱患猶在。
就在GPT-4o發(fā)布一天之后,消失在大眾視線很久的OpenAI聯(lián)合創(chuàng)始人、首席科學(xué)家Ilya Sutskever官宣離開OpenAI。去年11月,OpenAI管理層發(fā)生動(dòng)蕩,Sutskever被認(rèn)為是這場(chǎng)風(fēng)波背后的推手。不久前,OpenAI創(chuàng)始成員之一Andrej Karpathy也在Sora發(fā)布前夕離職。
在這場(chǎng)全新的技術(shù)革命中,隨著競(jìng)爭(zhēng)的重點(diǎn)由大模型技術(shù)轉(zhuǎn)向應(yīng)用側(cè),以“黑馬”姿態(tài)一度引領(lǐng)方向的OpenAI開始降速,新的轉(zhuǎn)折點(diǎn)也許已經(jīng)出現(xiàn)。
封面圖片來源:視覺中國圖
如需轉(zhuǎn)載請(qǐng)與《每日經(jīng)濟(jì)新聞》報(bào)社聯(lián)系。
未經(jīng)《每日經(jīng)濟(jì)新聞》報(bào)社授權(quán),嚴(yán)禁轉(zhuǎn)載或鏡像,違者必究。
讀者熱線:4008890008
特別提醒:如果我們使用了您的圖片,請(qǐng)作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站,可聯(lián)系我們要求撤下您的作品。
歡迎關(guān)注每日經(jīng)濟(jì)新聞APP