Google推出了一款可从简短文本生成逼真视频的新型ai模型Lumiere

ai发烧友 • 2024-01-30 下午11:45 • ai资讯, 技术前沿

Google推出了一款可从简短文本生成逼真视频的新型ai模型Lumiere

Lumiere创建的视频展示了逼真的运动，甚至可以使用图像和其他视频作为输入来改善结果。在题为《用于视频生成的时空扩散模型》的论文中揭示，Lumiere的工作方式与现有的视频生成模型不同。它一次性生成视频的时间持续，而现有的模型则通过合成关键帧，然后进行时间超分辨率。

简单来说，Lumiere关注图像中物体的运动，而以前的系统则通过已经发生运动的关键帧进行拼接视频。

该模型能够生成最高80帧的视频。相比之下，Stability的Stable Video Diffusion分别为14和25帧。帧数越多，视频的运动就越流畅。

据Google团队称，Lumiere在各种测试中均优于Pika、Meta和Runway等公司的竞争对手视频生成模型，包括零样本试验。

Google推出了一款可从简短文本生成逼真视频的新型ai模型Lumiere

研究人员还声称，Lumiere的输出可以用于内容创作任务和视频编辑，包括使用经过微调的文本到图像模型权重进行视频修补和风格化生成（模仿所展示的艺术风格）。

为了达到这个目的，Lumiere利用了一种新的架构，称为时空U-Net。这通过模型的单次传递一次性生成整个视频的时间持续。

Google团队写道，这种新颖的方法提高了输出的一致性。论文中写道：“通过部署空间和（重要的是）时间的降采样和升采样，并利用预训练的文本到图像扩散模型，我们的模型通过在多个时空尺度上处理来直接生成全帧率、低分辨率的视频。”

Google推出了一款可从简短文本生成逼真视频的新型ai模型Lumiere

Lumiere项目的目标是创建一个系统，使初学者更容易创建视频内容。

然而，论文承认了或许存在滥用的风险，特别是警告Lumiere等模型可能被用来创建虚假或有害的内容。

“我们认为，开发和应用检测偏见和恶意用例的工具是至关重要的，以确保安全和公平的使用，”论文中写道。

截至撰写本文时，Google尚未向公众提供该模型。但是，您可以在GitHub上的展示页面上探索各种示例生成。

发布者：ai发烧友，转转请注明出处：http://www.ouzou.cn/ai-jishu/4230.html

大模型生成式ai文生视频

赞 (0)

0 0

Runway vs Pika Labs测评——哪个是最好的ai视频工具？

上一篇 2024-01-29 下午9:43

OpenAI正在谈判投资机器人初创公司Figure：准备生产ChatGPT机器人？

下一篇 2024-01-31 下午11:50

ai资讯

麻省理工和IBM研究报告认为：人工智能自动化将逐步实现且不会导致大规模失业

麻省理工学院的研究团队联合IBM商业价值研究所进行的一项新研究深入探讨了人工智能对就业市场的影响，挑战了人工智能可能导致大规模失业的一种普遍观念。目前，对于工作场所中人工智能的研究主要集中在量化其在各个行业中潜在应用的各种可能性上。然而，这项研究关注了人工智能在工作场所自动执行任务的经济可行性，特别关注了计算机视觉领域。研究人员表示，他们采用的三方分析模…

ai发烧友
2024-01-26
000
ai资讯

亚马逊推出新的人工智能购物助手Rufus

亚马逊推出了一款名为Rufus的AI购物助手，它是一款基于生成式人工智能的购物工具，旨在改善用户的购物体验并帮助用户更好地进行购物决策。Rufus定位为一名专业的购物助理，可回答商品的相关问题，并提供建议、商品比较等服务。 Rufus的核心功能：1.回答商品相关问题：Rufus可以回答用户提出的关于商品的各种问题，例如商品详细信息、价格比较、客户评论和评分等…

ai发烧友
2024-02-02
000
技术前沿

Nvidia发布新驱动:RTX GPU通过ai将流媒体视频最高可升级至4K

今天，Nvidia为所有RTX GPU用户推出了一项新功能：RTX Video HDR。类似于Nvidia的RTX Video Super Resolution可以提升老旧、模糊的网络视频，RTX Video HDR利用人工智能将SDR色彩的视频转换为HDR。只需在Windows中启用HDR的HDR10兼容显示器即可。 RTX Video HDR是今天发布的…

ai发烧友
2024-01-24
000
ai教程

如何使用 Google Gemini ？

了解如何使用 Google Gemini 可以让您更深入地了解 AI 的工作原理。 Gemini 是 Google 对 ChatGPT 和 Microsoft Copilot 的回应，由早期实验性聊天机器人 Bard 更名而来。它建立在 Gemini 系列人工智能模型之上，不断更新新功能，包括图像生成和运行代码的能力。虽然 Gemini 最初是一个纯文本…

ai发烧友
2024-02-26
000
ai资讯

鳍源科技:AI潜水员追踪功能发布，首发搭载 FIFISH V-EVO 消费级水下无人机

鳍源科技日前发布了全新自研的水下AI技术，该技术为水下机器人领域带来了革新性的进步。鳍源科技表示，这是全球首个且唯一应用水下机器人 AI 潜水员追踪的功能技术，广泛运用于水下工程、生态保护、应急救援、水下赛事、休闲娱乐等领域，AI 潜水员追踪功能首发搭载 FIFISH V-EVO 消费级水下无人机。该技术是全球首个应用在水下机器人上的AI潜水员追踪技术。…

ai发烧友
2024-01-21
0116

发表回复