追赶OpenAI!中国发布视频生成AI Vidu:16秒1080p视频,能更好的理解中文元素

0
vidu

不久前,OpenAI推出新AI模型Sora,一句话就能生成1分钟左右的视频,而且画面极具真实感,直接颠覆了影像创作界,而现在中国还在步步紧逼,来自清华大学联合生推出了Vidu,一样具备生成时间长、一致性高的视频。

据了解,这个AI大模型采用了Diffusion与Transformer融合的U-ViY架构,能够一键生成长达16秒且分辨率高达1080p的视频内容。

Vidu研发团队的负责人,清华大学人工智能研究院副院长、生数科技首席科学家朱军解释起Vidu名字的含义:“Vidu意味着We do、We did、We do together。”

虽然说16秒视频对比Sora的一分钟还是逊色很多,但这也是目前已知最接近Sora能力的视频生成大模型,能够理解真实物理世界、生成富有想象力的画面等。

对于中国或是说华人用户而言,更为值得一提的特点有二,分别是它能够接受中文指令,并且更能够理解中国元素来进行创作

据了解,朱军与研发团队在2022年9月提出相关的技术架构,2023年3月推出UniDiffuser AI模型,在今年2月OpenAI发布Sora之后,该团队就基于自己对U-ViT架构的理解以及经验来推动相关的AI研发,在短短2个月就做到了生成16秒视频的程度。

朱军也表示,他们有望在今年内实现1分钟的视频生成。

Source :

About author

阿六

你永远还能做得更好,但你有时也会比你想象中的还要好

订阅
通知
guest

0 Comments
内联反馈
查看所有评论
0
希望听到您的想法,请评论x