每日經(jīng)濟新聞 2024-12-13 09:13:05
ChatGPT Plus和 Pro套餐的訂閱用戶以及所有Team用戶今后幾天內(nèi)可以運用高級語音模式Advanced Voice的視頻和共享屏幕功能,Enterprise和Edu版本明年1月上線新功能。OpenAI還在Advanced Voice的可選聲音中新增了截至明年1月的“節(jié)日特供”圣誕老人聲音。
每經(jīng)編輯 杜宇
OpenAI為期12個工作日的新產(chǎn)品和技術(shù)發(fā)布活動出了新王炸:在首次公開演示將近七個月后,OpenAI正式面向廣大付費用戶推出ChatGPT類人高級人工智能(AI)語音助手的新功能,包括視頻對話和實時屏幕共享,以及一個增添節(jié)日趣味的“圣誕老人”音色。
美東時間12月12日,OpenAI宣布,在ChatGPT的移動端應(yīng)用程序App中,上線ChatGPT高級語音模式Advanced Voice的視頻和共享屏幕功能。Advanced Voice由OpenAI的多模態(tài)模型GPT-4o支持。
視頻功能啟動方式很簡單,點擊對話框右下角的高級語音模式圖標(biāo),加載完成后點擊新增的“視頻”按鈕即可開始。
OpenAI的研究員在直播中演示了任何運用新功能,點擊ChatGPT聊天欄旁邊的語音圖標(biāo),然后點擊左下角的視頻圖標(biāo),就可以啟動視頻對話。如果想共享屏幕,手機用戶要點擊打開一個有三個喧囂的菜單,選擇其中的“共享屏幕”(Share Screen)。
在和ChatGPT的視頻對話中,OpenAI研究員提問,研究員先讓GPT看到并和現(xiàn)場的OpenAI工作人員分別打過招呼,然后問GPT,現(xiàn)場誰的打扮最像圣誕老人,誰像圣誕老人的馴鹿,GPT均作出準(zhǔn)確而回答。研究員演示了,給GPT轉(zhuǎn)發(fā)一個短信內(nèi)容及圖片,讓GPT建議如何回復(fù)對方的短信。
研究員還演示了,利用Advanced Voice的新功能讓GPT幫忙校對或者通過GPT學(xué)習(xí)新東西。比如找出一些制作手沖咖啡的咖啡壺、過濾杯等工具,向GPT展示并詢問如何使用這些工具,在操作時,讓GPT評價做得如何,并給出建議。
再來是屏幕共享功能。只需要把自己的屏幕內(nèi)容實時分享給 ChatGPT ,向它尋求幫助。點擊高級語音模式圖標(biāo)后,從下拉菜單中選擇“共享屏幕”選項即可。
Rowan繼續(xù)與ChatGPT分享了消息應(yīng)用中的對話內(nèi)容,請它幫忙編輯一條幽默禮貌的回復(fù)。
視頻對話是OpenAI今年5月首次演示高級語音模式后,就被用戶敲碗的新功能,如今總算兌現(xiàn)。能想到的使用場景有技能學(xué)習(xí),比如烹飪、手工制作、運動技巧,也可用于日常生活種答疑和景點、產(chǎn)品介紹等。
屏幕共享則支持用戶分享各種文檔內(nèi)容,獲取優(yōu)化建議,或是實時展示手機設(shè)備和軟件問題,讓ChatGPT提供實際解決方案。添加新交互方式后的語音模式,一定程度上也提升了對話的直觀性和實用性。
OpenAI表示,大多數(shù)ChatGPT Plus和Pro套餐的訂閱用戶以及所有Team用戶都將可以在今后幾天內(nèi)通過ChatGPT的App訪問12月12日推出的新功能,預(yù)計歐盟、瑞士、冰島、挪威和列支敦士登的ChatGPT Plus和Pro用戶也將很快可以運用新功能。ChatGPT的企業(yè)版和教育版Enterprise和Edu將于2025年1月上線新功能。
同時OpenAI宣布,在Advanced Voice這一高級語音模式中,新增了“限時”的圣誕老人聲音作為“節(jié)日特供”,有效期持續(xù)到明年1月初,在全球范圍內(nèi),所有移動、網(wǎng)絡(luò)和桌面App用戶都可選用。
點擊主界面雪花圖標(biāo),或在設(shè)置中啟用“圣誕老人”后,就可以和他語音對話了。即使用戶的高級語音額度已用完,首次與圣誕老人對話時,系統(tǒng)也會重置額度,確保人人都能體驗。
值得注意的是,今年5月OpenAI就在推出新旗艦?zāi)P虶PT-4o時演示了語音模式Voice Mode,不過該模式真正落地一波三折。
OpenAI原計劃6月末向一小批Plus計劃用戶推出該語音模式,6月又宣布推遲一個月發(fā)布,以便確保該功能安全有效地處理來自數(shù)百萬用戶的請求。當(dāng)時OpenAI稱,計劃今年秋季讓所有Plus用戶都可以訪問該功能,確切的時間表取決于是否達到內(nèi)部對安全性和可靠性的高標(biāo)準(zhǔn)。
7月末,OpenAI對有限的部分付費Plus用戶推出高級語音模式下的ChatGPT,稱語音模式無法模仿他人的說話方式,且增加了新的過濾器,保證軟件能夠發(fā)現(xiàn)并拒絕某些生成音樂或其他形式受版權(quán)保護音頻的請求。當(dāng)時上線的語音模式缺少5月OpenAI展示過的不少功能,比如計算機視覺功能,類似于本周四OpenAI宣布將要推出的視頻對話答問。
每日經(jīng)濟新聞綜合公開資料
如需轉(zhuǎn)載請與《每日經(jīng)濟新聞》報社聯(lián)系。
未經(jīng)《每日經(jīng)濟新聞》報社授權(quán),嚴(yán)禁轉(zhuǎn)載或鏡像,違者必究。
讀者熱線:4008890008
特別提醒:如果我們使用了您的圖片,請作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站,可聯(lián)系我們要求撤下您的作品。
歡迎關(guān)注每日經(jīng)濟新聞APP