Meta推出语音AI Voicebox：可以合成语音、降噪、转换语言！ - Zing Gadget

Meta推出语音AI Voicebox：可以合成语音、降噪、转换语言！

Post on: June 18, 2023

0

meta 1

Meta平台公司的人工智能实验室研究人员今天宣布，他们已经开发出一种名为“Voicebox”的生成性AI语音模型，这是一项重大突破。Voicebox能够完成各种任务，如合成语音、样式设计和内容编辑。

简而言之，就是一个语音版的Midjourney，能够生成各种声音，具体能做到的任务包括：

上下文文本到语音合成：使用短至两秒的音频样本，Voicebox可以匹配音频风格并用于文本到语音的生成。
语音编辑和噪声减少：Voicebox可以重建被噪声打断的语音部分，或替换错误的词语，而无需重新录制整个语音。例如，您可以识别被狗叫声打断的语音段落，剪裁它，然后指示Voicebox重新生成那个段落，就像音频编辑的橡皮擦一样。
跨语言风格转换：当给出某人的语音样本和英语、法语、德语、西班牙语、波兰语或葡萄牙语的文本段落时，Voicebox可以生成任何这些语言的文本阅读，即使样本语音和文本是不同的语言。这种能力未来可能被用于帮助人们以自然、真实的方式交流，即使他们不会说同一种语言。

研究人员表示：“我们用超过50,000小时的录音演讲和公共领域有声读物的转录（包括英语、法语、西班牙语、德语、波兰语和葡萄牙语）来训练Voicebox。当给出周围的语音和片段的转录时，Voicebox被训练来预测一个语音片段。”

尽管研究人员指出这是一个令人兴奋的突破，但他们对其能力和滥用的可能性提出了警告。因此，Voicebox模型及其代码并未向公众开放。

目前，Meta AI分享的关于Voicebox的信息包括公告、音频样本和详细介绍其所取得成果的研究论文。

延伸阅读：

不应该担心？META首席AI科学家：目前AI智力连狗都不如，不应该被视为威胁！

首位AI DJ诞生！美国电台用RADIOGPT打造AI DJ，主持时间长达5小时！

CHATGPT成“牧师”？德国教堂用AI当牧师传教，吸引300多人排队1小时参与！

Source :

siliconangle, fb

About author

阿六

你永远还能做得更好，但你有时也会比你想象中的还要好

订阅

0 Comments

内联反馈

查看所有评论

0

希望听到您的想法，请评论x

()