avater
(Mandy)-優分析產業數據中心.2024.11.26

AI|輝達Nvidia的AI模型Fugatto不只可以修改聲音,還能讓音樂創作更輕鬆!

圖片來源:Nvidia官網

2024年11月26日(優分析產業數據中心)

輝達Nvidia(NVDA-US)於週一展示一種新的人工智慧(AI)模型,用於生成音樂和音訊,可以修改聲音並生成新奇的聲音。這項技術名為Fugatto(Foundational Generative Audio Transformer Opus 1的縮寫),其主要目標客群為音樂、電影和影像遊戲的製作人。

作為全球最大的AI晶片與軟體供應商,Nvidia表示,目前尚無計畫對外公開此技術。競爭者包括新創公司Runway與科技巨頭Meta Platforms,已展示根據文字提示生成音訊或影片的類似技術。

生成式人工智慧(Generative AI)的進步可能引領新一波內容創作與消費熱潮,刺激相關硬體需求(如高效能的GPU)。

Nvidia持續投入生成式AI研究,特別是在聲音技術領域的佈局,維持技術領先優勢。

Fugatto的特殊功能是什麼?

Fugatto能根據文字描述生成音效與音樂,甚至創造出新奇的聲音,如讓喇叭模仿狗叫聲。

與其他AI技術不同的是,Fugatto能夠接收和修改現有的音訊,如將鋼琴演奏的旋律轉換為人聲演唱,或者將錄製的語音改變口音與情緒表達。

Nvidia應用深度學習研究副總裁Bryan Catanzaro表示:「如果我們回顧過去50年的合成音訊發展,會發現現在的音樂因電腦與合成器而變得有所不同。我認為生成式AI將為音樂、影像遊戲以及希望創作內容的普通人帶來全新的能力。」

技術公開面臨的挑戰與風險

目前,像OpenAI這樣的公司正在與好萊塢商討如何使用AI於娛樂行業,但科技業與好萊塢之間的關係已經變得緊張。

尤其是OpenAI於5月為其ChatGPT聊天機器人推出了語音功能,但卻引發爭議,好萊塢演員Scarlett Johansson指控該公司模仿她的聲音。

Nvidia表示,Fugatto是基於開源數據進行訓練的,但是否以及如何公開這項技術仍在討論中。

Nvidia副總裁表示:「任何生成式技術都存在風險,因為有人可能會利用其來生成我們不希望出現的內容。我們必須對此保持謹慎,這也是為什麼我們目前無法立即公開此技術。」

目前,生成式AI的開發者尚未找到有效方法來防止技術濫用,如用戶生成虛假信息或侵犯版權內容(如生成受版權保護的角色)。

與此類似,OpenAI與Meta也尚未宣布何時會對外公開生成音訊或影片的模型。

 

相關新聞

輝達NVIDIA黃仁勳:全球科技合作將延續,談論AI的可持續能源應用與未來展望

這篇文章對你來說實用嗎?
很實用!
還可以
有待加強...
標籤關鍵字
AI
人工智慧
輝達
Nvidia