疯了！Meta的AI可以根据语音指令生成视频

2022-10-03 15:32

来自Facebook母公司Meta的一个机器学习工程师团队公布了一个名为Make-A-Video的新系统。顾名思义，这个人工智能模型允许用户键入一个场景的粗略描述，它将生成一个与他们的文字相匹配的短视频。这些视频显然是人造的，主体模糊，动画扭曲，但仍然代表了人工智能内容生成领域的一个重大发展。

近几个月来，人工智能文本-图像生成器一直是头条新闻，但研究人员已经在向下一个前沿领域迈进。人工智能文本到视频生成器。

该模型的输出显然是人工的，但仍然令人印象深刻

"梅塔在宣布这项工作的博文中说："生成性人工智能研究正在推动创造性表达，为人们提供了快速和轻松创造新内容的工具。"只需几个字或几行文字，Make-A-Video就能将想象力带入生活，创造出充满生动色彩和风景的独一无二的视频。"

在Facebook的一篇文章中，Meta首席执行官马克-扎克伯格将这项工作描述为 "惊人的进步"，并补充说。"生成视频比生成照片难得多，因为除了正确生成每个像素，系统还必须预测它们将如何随时间变化。

这些片段不超过5秒，不包含音频，但跨越了巨大的提示范围。判断该模型性能的最好方法是观看其输出。下面的每段视频都是由Make-A-Video生成的，并标明了用于生成视频的提示。然而，值得注意的是，每个视频都是由Meta公司提供给The Verge的，该公司目前不允许任何人访问该模型。这意味着这些片段可能被挑选出来，以展示该系统的最佳状态。

THE END

责任编辑：李斌

相关阅读

展会预告

新品

中维世纪新品 | 这样的火眼金睛，才够格做“黑悟空”“天命人”
中维世纪又推智能场景机!此次场景机在看清电子屏幕的基础上，增加字符提取与超阈值报警功能，超清视野与灵…
中维世纪新品 | 这样的火眼金睛，才够格做“黑悟空”“天命人”
思特威推出具有AOV快启功能的5MP高分辨率IoT图像传感器SC535IoT
思特威推出0.7微米5000万像素图像传感器SC5000CS
云天励飞发布新一代AI芯片DeepEdge10
爱芯元智发布新一代IPC SoC芯片AX630C和AX620Q

访谈

做行业赋能者 HID迎接数字化浪潮新机遇破解新挑战

今年3月份，全球可信身份解决方案提供商HID发布了最新的《安防行业现状报告》（以下简称“报告”），该报告…
数字化浪潮下，安防厂商如何满足行业客户的定制化需求?

回顾近两年，受疫情因素影响，包括安防在内的诸多行业领域都遭受了来自市场 “不确定性”因素的冲击，市场…
博思高邓绍昌：乘产品创新及客户服务之舟，在市场变革中逆风飞扬

11月24日，由慧聪物联网、慧聪安防网、慧聪电子网主办的2022(第十九届)中国物联网产业大会暨品牌盛会，在深…

企业

圣恩科技：守护城市生命线
树立行业标杆，讲好中国故事，传递中国声音，充分展现腾飞的中国经济、崛起的民族品牌和向上的企业家精神。…
佳都科技“数智堤坝”助力地铁安全度汛
高新兴与麒麟软件达成战略合作，加速国产化应用生态布局与落地
圣恩科技：守护城市生命线
熵基科技在多模态BioCV技术领域取得新突破
捷顺科技发布“停充一体”标准，打造一站式停充服务，推动停车充电行业规范发展