疯了!Meta的AI可以根据语音指令生成视频

来自Facebook母公司Meta的一个机器学习工程师团队公布了一个名为Make-A-Video的新系统。顾名思义,这个人工智能模型允许用户键入一个场景的粗略描述,它将生成一个与他们的文字相匹配的短视频。这些视频显然是人造的,主体模糊,动画扭曲,但仍然代表了人工智能内容生成领域的一个重大发展。

近几个月来,人工智能文本-图像生成器一直是头条新闻,但研究人员已经在向下一个前沿领域迈进。人工智能文本到视频生成器。

来自Facebook母公司Meta的一个机器学习工程师团队公布了一个名为Make-A-Video的新系统。顾名思义,这个人工智能模型允许用户键入一个场景的粗略描述,它将生成一个与他们的文字相匹配的短视频。这些视频显然是人造的,主体模糊,动画扭曲,但仍然代表了人工智能内容生成领域的一个重大发展。

该模型的输出显然是人工的,但仍然令人印象深刻

"梅塔在宣布这项工作的博文中说:"生成性人工智能研究正在推动创造性表达,为人们提供了快速和轻松创造新内容的工具。"只需几个字或几行文字,Make-A-Video就能将想象力带入生活,创造出充满生动色彩和风景的独一无二的视频。"

在Facebook的一篇文章中,Meta首席执行官马克-扎克伯格将这项工作描述为 "惊人的进步",并补充说。"生成视频比生成照片难得多,因为除了正确生成每个像素,系统还必须预测它们将如何随时间变化。

这些片段不超过5秒,不包含音频,但跨越了巨大的提示范围。判断该模型性能的最好方法是观看其输出。下面的每段视频都是由Make-A-Video生成的,并标明了用于生成视频的提示。然而,值得注意的是,每个视频都是由Meta公司提供给The Verge的,该公司目前不允许任何人访问该模型。这意味着这些片段可能被挑选出来,以展示该系统的最佳状态。

THE END
责任编辑:李斌
免责声明:本站所使用的字体和图片文字等素材部分来源于互联网共享平台。如使用任何字体和图片文字有冒犯其版权所有方的,皆为无意。如您是字体厂商、图片文字厂商等版权方,且不允许本站使用您的字体和图片文字等素材,请联系我们,本站核实后将立即删除!任何版权方从未通知联系本站管理者停止使用,并索要赔偿或上诉法院的,均视为新型网络碰瓷及敲诈勒索,将不予任何的法律和经济赔偿!敬请谅解!
Baidu
map