微軟正在發明一種智能音頻合成技術用于為各種媒體如電影、電視節目等

2022-11-21 11:16:02來源：IT之家

11 月 20 日消息，微軟近日在 WIPO 知識產權門戶網站上提交了一項專利，專利題為“用于合成音頻的人工智能模型”。

專利說明微軟正在發明一種智能音頻合成技術，用于為各種媒體如電影、電視節目、游戲，甚至現場錄音創造聲音、音樂和其它音頻元素。該專利提到了游戲中的動態時刻，表明它可以創造出配合玩家行動的樂譜。該專利的摘要指出，可以使用視覺、音頻和文本特征及提示(統稱為“數據集”)來設置參數，以指導眾多的人工智能模型構建音頻樂譜。

IT之家了解到，人工智能在視頻游戲中發揮著不可或缺的作用。從敵人的行為和戰斗遭遇到程序性關卡的生成以及與 NPC 和環境的互動，人工智能在游戲開發的各個層面都是不可或缺的。在聲音設計方面，自適應 / 動態配樂在許多視頻游戲中都有體現，如現代《毀滅戰士》游戲、《合金裝備崛起》、《鬼泣 5》等。

微軟的新專利描述詳細介紹了眾多的人工智能引擎，這些引擎的任務是根據提供的數據集進行音頻播放。他們可以分析人類的表情和情緒，收集位置數據，分析形勢的基調等等。人工智能可以學習圖片、視頻、電影、現場活動，并產生一組音頻文件，可以用適當的聲音效果和音樂為視覺效果分層。這種高科技的人工智能可以為媒體創作開辟許多令人興奮的道路，人們可以用一個巨大的、不斷增長的音頻樂譜庫來制作電影、游戲等，例如為英雄的出場設計一首史詩般的管弦樂曲，為寵物的離去譜寫一首憂郁的曲子，為槍聲和爆炸開發音效，所有這些都可以委托給人工智能的算法。

IT之家了解到，該技術將由云計算驅動。該系統何時能真正投入使用還有待觀察，但音頻設計的未來看起來很有希望，微軟可能會在這方面掌舵一場革命。

關鍵詞：微軟智能