Meta推出语音AI Voicebox:可以合成语音、降噪、转换语言!

0
meta 1

Meta平台公司的人工智能实验室研究人员今天宣布,他们已经开发出一种名为“Voicebox”的生成性AI语音模型,这是一项重大突破。Voicebox能够完成各种任务,如合成语音、样式设计和内容编辑。

简而言之,就是一个语音版的Midjourney,能够生成各种声音,具体能做到的任务包括:

  • 上下文文本到语音合成:使用短至两秒的音频样本,Voicebox可以匹配音频风格并用于文本到语音的生成。
  • 语音编辑和噪声减少:Voicebox可以重建被噪声打断的语音部分,或替换错误的词语,而无需重新录制整个语音。例如,您可以识别被狗叫声打断的语音段落,剪裁它,然后指示Voicebox重新生成那个段落,就像音频编辑的橡皮擦一样。
  • 跨语言风格转换:当给出某人的语音样本和英语、法语、德语、西班牙语、波兰语或葡萄牙语的文本段落时,Voicebox可以生成任何这些语言的文本阅读,即使样本语音和文本是不同的语言。这种能力未来可能被用于帮助人们以自然、真实的方式交流,即使他们不会说同一种语言。

研究人员表示:“我们用超过50,000小时的录音演讲和公共领域有声读物的转录(包括英语、法语、西班牙语、德语、波兰语和葡萄牙语)来训练Voicebox。当给出周围的语音和片段的转录时,Voicebox被训练来预测一个语音片段。”

尽管研究人员指出这是一个令人兴奋的突破,但他们对其能力和滥用的可能性提出了警告。因此,Voicebox模型及其代码并未向公众开放。

目前,Meta AI分享的关于Voicebox的信息包括公告、音频样本和详细介绍其所取得成果的研究论文。

延伸阅读:

不应该担心?META首席AI科学家:目前AI智力连狗都不如,不应该被视为威胁!

首位AI DJ诞生!美国电台用RADIOGPT打造AI DJ,主持时间长达5小时!

CHATGPT成“牧师”?德国教堂用AI当牧师传教,吸引300多人排队1小时参与!


Source :

About author

阿六

你永远还能做得更好,但你有时也会比你想象中的还要好

订阅
通知
guest

0 Comments
内联反馈
查看所有评论
0
希望听到您的想法,请评论x