科技日報記者 張夢然
據(jù)著名科技網(wǎng)站The Verge報道,OpenAI公司3月29日最新推出了一項名為“語音引擎”(Voice Engine)的人工智能工具,其僅憑一段15秒的聲音樣本,便能夠精準模仿出該人的聲音。
“語音引擎”已用于 ChatGPT 的朗讀功能。
圖片來源:OpenAI
OpenAI稱,該引擎自2022年底以來一直在開發(fā)中,實際已在ChatGPT應用程序的“大聲朗讀”功能中應用,該功能顧名思義會向用戶朗讀相關內容。
用戶只需利用15秒的樣本來訓練聲音,就可讓它以一種“情感和現(xiàn)實”的方式讀出喜歡的任何文本。OpenAI表示,它可用于教育目的,將播客翻譯成新語言。OpenAI發(fā)布的剪輯聽起來令人印象深刻,盡管它們有輕微生硬的機器人痕跡。
“語音引擎”展示了一些已經(jīng)開始應用的例子。如生成更自然、更富有情感的聲音;將視頻內容翻譯成多種語言,以拓寬其全球受眾范圍。這項技術的一大特色是,在翻譯過程中能夠保留演講者原有的口音特征,為翻譯增添了更多真實感和個性化色彩。
“語音引擎”還可為語言障礙者提供支持,例如開發(fā)針對語言障礙者的治療應用,為有特殊學習需求的人提供教育輔助,使用戶能選擇最能體現(xiàn)其個性的聲音,并且對那些使用多種語言的用戶,保持在各種語言中聲音的一致性?!罢Z音引擎”使用一位年輕患者之前為學校項目錄制的視頻音頻,成功恢復了她因血管性腦瘤而失去的流暢語言能力。
OpenAI目前并未立即向市場全面推廣,而是選擇與少數(shù)早期測試者謹慎地合作,共同探索“語音引擎”的應用可能和潛在風險。
“語音引擎”目前僅處于有限測試階段,主要原因是擔心被濫用。OpenAI指出,“語音引擎”可能導致語音身份驗證措施出現(xiàn)問題,以及讓大眾在誤以為自己與熟人通話的情況下涉入騙局。
OpenAI表示希望進行更多研究,以確保此類工具無法在未經(jīng)同意的情況下用于傳播錯誤信息和復制聲音。
責任編輯: 常麗君本文鏈接:http://www.3ypm.com.cn/news-2-6075-0.html“語音引擎”可從15秒樣本復制原聲
聲明:本網(wǎng)頁內容由互聯(lián)網(wǎng)博主自發(fā)貢獻,不代表本站觀點,本站不承擔任何法律責任。天上不會到餡餅,請大家謹防詐騙!若有侵權等問題請及時與本網(wǎng)聯(lián)系,我們將在第一時間刪除處理。
上一篇:科技創(chuàng)新世界潮|人工智能開啟氣象預測新紀元
下一篇:迄今世界最強激光器啟動
點擊右上角微信好友
朋友圈
點擊瀏覽器下方“”分享微信好友Safari瀏覽器請點擊“”按鈕
點擊右上角QQ
點擊瀏覽器下方“”分享QQ好友Safari瀏覽器請點擊“”按鈕