追赶OpenAI！中国发布视频生成AI Vidu：16秒1080p视频，能更好的理解中文元素 - Zing Gadget

追赶OpenAI！中国发布视频生成AI Vidu：16秒1080p视频，能更好的理解中文元素

Post on: April 29, 2024

0

vidu

不久前，OpenAI推出新AI模型Sora，一句话就能生成1分钟左右的视频，而且画面极具真实感，直接颠覆了影像创作界，而现在中国还在步步紧逼，来自清华大学联合生推出了Vidu，一样具备生成时间长、一致性高的视频。

据了解，这个AI大模型采用了Diffusion与Transformer融合的U-ViY架构，能够一键生成长达16秒且分辨率高达1080p的视频内容。

Vidu研发团队的负责人，清华大学人工智能研究院副院长、生数科技首席科学家朱军解释起Vidu名字的含义：“Vidu意味着We do、We did、We do together。”

虽然说16秒视频对比Sora的一分钟还是逊色很多，但这也是目前已知最接近Sora能力的视频生成大模型，能够理解真实物理世界、生成富有想象力的画面等。

对于中国或是说华人用户而言，更为值得一提的特点有二，分别是它能够接受中文指令，并且更能够理解中国元素来进行创作

据了解，朱军与研发团队在2022年9月提出相关的技术架构，2023年3月推出UniDiffuser AI模型，在今年2月OpenAI发布Sora之后，该团队就基于自己对U-ViT架构的理解以及经验来推动相关的AI研发，在短短2个月就做到了生成16秒视频的程度。

朱军也表示，他们有望在今年内实现1分钟的视频生成。

Source :

ebrun, 东方日报

About author

阿六

你永远还能做得更好，但你有时也会比你想象中的还要好

订阅

0 Comments

内联反馈

查看所有评论

0

希望听到您的想法，请评论x

()