OpenAI與谷歌的又一次技術交鋒剛剛落下帷幕。
北京時間5月14日凌晨,OpenAI發(fā)布了新一代多模態(tài)人工智能(AI)大模型GPT-4o,其先進的AI語音交互技術迅速吸引了人們的目光。
一天之后,谷歌在北京時間15日凌晨的I/O 2024開發(fā)者大會上,攜新版Gemini AI大模型等尖端產品重裝上陣,正面對決OpenAI,燃起新一輪AI領域爭霸的戰(zhàn)火。
GPT-4o語音對話絲滑如真人
一個擁有流暢、迷人嗓音的逼真AI,可以讓人類用戶著迷并留下深刻的印象。調情、講笑話、滿足人類的欲望,并最終留住他們的心……這是2013年美國上映的電影《她》中的情節(jié)。在這部影片中,一位叫薩曼莎的虛擬姑娘讓孤獨內向的男主深陷其中。
事實上,這也是OpenAI展示的新模型GPT-4o所能讓人聯(lián)想到的情節(jié)。
據OpenAI介紹,GPT-4o是一個“原生多模態(tài)”模型。它命名中的o來源于“omni”一詞,意為“全能的”,有包羅萬象之意。它可以接受文本、音頻和圖像任意組合的輸入,并生成這些格式的相應輸出。新模型使ChatGPT能夠處理50種不同的語言,速度和質量同時得到提高。它可以在短短232毫秒內處理音頻輸入,平均耗時320毫秒,與人類對話中的反應時間相當。
GPT-4o允許ChatGPT以更加逼真的方式與用戶交流。它不僅能檢測用戶聲音中的情緒,分析面部表情,還能根據用戶需求改變語調和節(jié)奏。如果想聽睡前故事,它可以用耳語說話。如果需要來一段帶“酸味兒”的對話,它就能以輕松、諷刺的語氣與人交談。它甚至還可以按要求唱歌,一會兒是高亢的女高音,一會兒又能變成迷人的女低音。
有趣的是,就在GPT-4o官宣發(fā)布后,一名OpenAI的員工發(fā)布了一條意味深長的信息:“你們都會愛上它的。”
Astra讓AI與人們生活無縫融合
OpenAI發(fā)布了GPT-4o后,壓力就給到了谷歌。谷歌在發(fā)布會上,放出大招向OpenAI“開戰(zhàn)”,勢必要扳回一局。
谷歌在整個大會中共提到“AI”121次,并推出了從新的搜索和聊天功能到面向云客戶的AI硬件等十余種新品和升級產品。其中包括由升級后Gemini模型驅動的AI助手項目Astra、對標Sora的文生視頻模型Veo,以及第六代Tensor處理器單元(TPU)Trillium芯片。
Astra是一次旨在創(chuàng)建“通用人工智能代理”的新嘗試。與GPT-4o一樣,Astra具有以各種形式或多模式方式快速響應用戶的卓越能力,這使得它非常適合成為AI助手。
谷歌表示,通過對視頻幀和語音輸入進行連續(xù)處理和編碼,Astra可以創(chuàng)建事件時間軸并緩存信息,以便快速調用。這使AI能看、能聽、能說,甚至能回憶。在一段引人入勝的視頻中,這款模型通過智能手機的攝像頭識別出現(xiàn)實世界中的物體,能直接讀取代碼,甚至能幫用戶回憶起他的眼鏡落在了哪里,還能幾乎零延遲與人實時對話。
生成式AI革命遠未成功
自ChatGPT宣告問世,谷歌和OpenAI的競爭就不斷升級?,F(xiàn)在,兩大科技巨頭更是在兩天時間里紛紛亮出引人矚目的產品。
然而,生成式AI的飛速發(fā)展也伴隨著眾多質疑的聲音。人們對于這些科技公司所塑造的“AI未來”仍持謹慎態(tài)度。
《新科學家》雜志網站稱,人們應該認識到,生成式AI的成功還遠未確定。這個領域還很新,公司之間競爭的目的并不是市場份額或客戶忠誠度,而僅僅是為了擁有最新產品。新的GPT-4o盡管更有“人味兒”,但AI胡編亂造的行為未必能得到限制。
根據美國皮尤研究中心的調查,盡管ChatGPT在過去幾年聲勢浩大,但只有23%的美國成年人使用過它。英國牛津大學卡麗莎·維利茲副教授稱:“這項技術到底有多大影響,目前還很不明確。大多數(shù)人尚未體驗過生成式AI工具,有理由認為,這項技術最終可能不如一些人想象的那樣具有革命性。”
OpenAI與谷歌的又一次技術交鋒剛剛落下帷幕。
北京時間5月14日凌晨,OpenAI發(fā)布了新一代多模態(tài)人工智能(AI)大模型GPT-4o,其先進的AI語音交互技術迅速吸引了人們的目光。
一天之后,谷歌在北京時間15日凌晨的I/O 2024開發(fā)者大會上,攜新版Gemini AI大模型等尖端產品重裝上陣,正面對決OpenAI,燃起新一輪AI領域爭霸的戰(zhàn)火。
GPT-4o語音對話絲滑如真人
一個擁有流暢、迷人嗓音的逼真AI,可以讓人類用戶著迷并留下深刻的印象。調情、講笑話、滿足人類的欲望,并最終留住他們的心……這是2013年美國上映的電影《她》中的情節(jié)。在這部影片中,一位叫薩曼莎的虛擬姑娘讓孤獨內向的男主深陷其中。
事實上,這也是OpenAI展示的新模型GPT-4o所能讓人聯(lián)想到的情節(jié)。
據OpenAI介紹,GPT-4o是一個“原生多模態(tài)”模型。它命名中的o來源于“omni”一詞,意為“全能的”,有包羅萬象之意。它可以接受文本、音頻和圖像任意組合的輸入,并生成這些格式的相應輸出。新模型使ChatGPT能夠處理50種不同的語言,速度和質量同時得到提高。它可以在短短232毫秒內處理音頻輸入,平均耗時320毫秒,與人類對話中的反應時間相當。
GPT-4o允許ChatGPT以更加逼真的方式與用戶交流。它不僅能檢測用戶聲音中的情緒,分析面部表情,還能根據用戶需求改變語調和節(jié)奏。如果想聽睡前故事,它可以用耳語說話。如果需要來一段帶“酸味兒”的對話,它就能以輕松、諷刺的語氣與人交談。它甚至還可以按要求唱歌,一會兒是高亢的女高音,一會兒又能變成迷人的女低音。
有趣的是,就在GPT-4o官宣發(fā)布后,一名OpenAI的員工發(fā)布了一條意味深長的信息:“你們都會愛上它的。”
Astra讓AI與人們生活無縫融合
OpenAI發(fā)布了GPT-4o后,壓力就給到了谷歌。谷歌在發(fā)布會上,放出大招向OpenAI“開戰(zhàn)”,勢必要扳回一局。
谷歌在整個大會中共提到“AI”121次,并推出了從新的搜索和聊天功能到面向云客戶的AI硬件等十余種新品和升級產品。其中包括由升級后Gemini模型驅動的AI助手項目Astra、對標Sora的文生視頻模型Veo,以及第六代Tensor處理器單元(TPU)Trillium芯片。
Astra是一次旨在創(chuàng)建“通用人工智能代理”的新嘗試。與GPT-4o一樣,Astra具有以各種形式或多模式方式快速響應用戶的卓越能力,這使得它非常適合成為AI助手。
谷歌表示,通過對視頻幀和語音輸入進行連續(xù)處理和編碼,Astra可以創(chuàng)建事件時間軸并緩存信息,以便快速調用。這使AI能看、能聽、能說,甚至能回憶。在一段引人入勝的視頻中,這款模型通過智能手機的攝像頭識別出現(xiàn)實世界中的物體,能直接讀取代碼,甚至能幫用戶回憶起他的眼鏡落在了哪里,還能幾乎零延遲與人實時對話。
生成式AI革命遠未成功
自ChatGPT宣告問世,谷歌和OpenAI的競爭就不斷升級?,F(xiàn)在,兩大科技巨頭更是在兩天時間里紛紛亮出引人矚目的產品。
然而,生成式AI的飛速發(fā)展也伴隨著眾多質疑的聲音。人們對于這些科技公司所塑造的“AI未來”仍持謹慎態(tài)度。
《新科學家》雜志網站稱,人們應該認識到,生成式AI的成功還遠未確定。這個領域還很新,公司之間競爭的目的并不是市場份額或客戶忠誠度,而僅僅是為了擁有最新產品。新的GPT-4o盡管更有“人味兒”,但AI胡編亂造的行為未必能得到限制。
根據美國皮尤研究中心的調查,盡管ChatGPT在過去幾年聲勢浩大,但只有23%的美國成年人使用過它。英國牛津大學卡麗莎·維利茲副教授稱:“這項技術到底有多大影響,目前還很不明確。大多數(shù)人尚未體驗過生成式AI工具,有理由認為,這項技術最終可能不如一些人想象的那樣具有革命性。”
本文鏈接:http://www.3ypm.com.cn/news-2-5016-0.htmlOpenAI和谷歌再度燃起爭霸烽火
聲明:本網頁內容由互聯(lián)網博主自發(fā)貢獻,不代表本站觀點,本站不承擔任何法律責任。天上不會到餡餅,請大家謹防詐騙!若有侵權等問題請及時與本網聯(lián)系,我們將在第一時間刪除處理。
上一篇:血液蛋白有望提前7年揭示癌癥風險
點擊右上角微信好友
朋友圈
點擊瀏覽器下方“”分享微信好友Safari瀏覽器請點擊“”按鈕
點擊右上角QQ
點擊瀏覽器下方“”分享QQ好友Safari瀏覽器請點擊“”按鈕