Google 宣布其最新的 AI 视频生成模型 Veo 2 正式上线,现已向 Google One AI Premium 订阅用户开放。
Gemini Advanced 用户现可通过文字提示生成高达 720p 分辨率的 8 秒 MP4 视频,而 Google Labs 的实验性平台 Whisk 也新增了 Whisk Animate 功能,允许用户将静态图像转化为动态视频。
Veo 2:文字转视频,呈现电影级画面
Veo 2 是 Google 最新的文本转视频 AI 模型,能够根据用户输入的文字提示生成高质量、细节丰富的视频。该模型对现实世界物理和人物动作有更深入的理解,使得生成的视频在角色动作和场景表现上更为流畅和逼真。
用户可在 Gemini 应用中选择 Veo 2 模型,输入描述性的文字,即可生成 8 秒、720p 分辨率、16:9 横向格式的 MP4 视频。生成的视频带有 SynthID 数字水印,标识其为 AI 生成内容。
此外,用户可直接通过 Gemini 的分享按钮,将视频上传至 TikTok、YouTube Shorts 等平台。不过需要注意的是,目前每月用户可创建的视频数量存在限制,且 Google Workspace 的商业和教育计划暂不支持该功能。
Whisk Animate:将图像转化为动态视频
Google Labs 的实验性平台 Whisk 也引入了 Veo 2 模型,推出了 Whisk Animate 功能。该功能允许用户将通过 Whisk 生成的图像转化为 8 秒的动态视频,进一步拓展了创作的可能性。目前,Whisk Animate 仅对 Google One AI Premium 订阅用户开放,用户可通过 labs.google/whisk 体验该功能。
安全与透明性措施
为确保生成内容的安全性和透明性,Google 对 Veo 2 模型进行了广泛的测试和评估,以防止生成违反政策的内容。此外,所有通过 Veo 2 生成的视频均嵌入了 SynthID 数字水印,以标识其为 AI 生成内容。用户在使用过程中,如有任何反馈,可通过 Gemini 应用中的点赞或点踩按钮提供意见,Google 将持续改进模型表现。
Veo 2 的推出标志着 Google 在生成式 AI 领域的又一重要进展,为创作者提供了更强大的工具,也为内容创作带来了新的可能性。用户可通过 gemini.google.com 体验该功能,或访问 labs.google/whisk 探索更多创作方式。