OpenAI 凭借 Chat-GPT 及其文本转图像生成器 DALL-E 席卷了人工智能世界,并通过新的文本转视频sora平台加大了赌注。
![OpenAI推出文生视频新模型sora,可生成长达1分钟视频](http://www.ouzou.cn/wp-content/themes/justnews/themer/assets/images/lazy.png)
这家科技巨头周四(2 月 15 日)推出了 Sora。它是一款基于人工智能的文本到视频生成器,允许用户仅使用文本提示即可创建长达一分钟的视频。 Sora 由一个简单的文本框提供支持,允许用户输入他们想要的任何文本提示。然后,无论他们的请求有多详细,它都会返回与他们请求的内容相匹配的视频。
OpenAI 宣布这一消息后,首席执行官 Sam Altman 在 X(前身为 Twitter)上征求关注者的提示。然后,他根据这些请求转发了视频,其中包括两只金毛猎犬在山顶上播客的视频之一。 Sora 轻松生成了视频:
![OpenAI推出文生视频新模型sora,可生成长达1分钟视频](http://www.ouzou.cn/wp-content/themes/justnews/themer/assets/images/lazy.png)
OpenAI 的网站上还有很多 Sora 的实际例子,包括一段由文本提示生成的视频,例如“一窝金毛小狗在雪地里玩耍”。由此产生的镜头看起来非常逼真,即使一些被抛洒的雪的物理特性可能需要一些微调。
![OpenAI推出文生视频新模型sora,可生成长达1分钟视频](http://www.ouzou.cn/wp-content/themes/justnews/themer/assets/images/lazy.png)
文本提示可以非常具体,但仍然会产生一些令人印象深刻的结果。以下是根据这个详细提示制作的视频:“电影预告片,讲述了 30 岁太空人戴着红色羊毛针织摩托车头盔的冒险经历,蓝天,盐漠,电影风格,35 毫米胶片拍摄,色彩鲜艳”。
![OpenAI推出文生视频新模型sora,可生成长达1分钟视频](http://www.ouzou.cn/wp-content/themes/justnews/themer/assets/images/lazy.png)
目前Sora 并不可供公众使用,该公司在一篇博客文章中明确表示,它只提供给一些测试人员和创意社区的人员进行尝试,以期做出改进。 OpenAI 没有透露 Sora 何时会公开发布,不过该公司告诉 NBC 新闻,它不会“很快在我们的产品中广泛使用”。
尽管如此,考虑到该领域还有其他公司,包括美国的 Runway 和英国的 Synthesia,Sora 似乎可能会在不久的将来像大众推出。
![OpenAI推出文生视频新模型sora,可生成长达1分钟视频](http://www.ouzou.cn/wp-content/themes/justnews/themer/assets/images/lazy.png)
虽然 OpenAI 的最初视频很有趣,而且这项技术对于那些完全投资于人工智能的人来说听起来很令人兴奋,但它引发了人们对该平台所能创建的内容的局限性的疑问。随着互联网上的 Deepfake(深伪) 数量不断增加,Sora 很容易被用于生成具有误导性或非法内容。考虑到某些人利用sora生成视频的精细程度,用户创建虚假视频并分享到社交媒体上(但其他人认为是真实的)的可能性也不是没有。
为了解决这个问题,OpenAI 表示,它计划在其视频中嵌入元数据和其他工件,以便互联网用户可以快速确定视频是否是使用 Sora 创建的。该公司还希望其测试人员和专家团队能够识别不良行为者可能产生错误信息或其他有害内容的领域,并在 Sora 公开之前将其消除。
尽管如此,OpenAI 承认它可能无法解决所有可能性。
OpenAI 在一篇博客文章中表示:“尽管进行了广泛的研究和测试,我们仍无法预测人们将使用我们的技术的所有有益方式,也无法预测人们将滥用我们的技术的所有方式。” “这就是为什么我们相信,从现实世界的使用中学习是随着时间的推移创建和发布越来越安全的人工智能系统的关键组成部分。”
乍一看,Sora 的视频看起来很有趣,但有些显然是假的,缺乏你所期望的现实世界视频的分辨率和真实感。尽管如此,由于有足够的时间来测试和改进,如果 Sora 向公众开放,看看它能做到哪一步,应该会很有趣。
发布者:ai发烧友,转转请注明出处:http://www.ouzou.cn/ai-jishu/4319.html