为sora配音的ai生成工具ElevenLabs

人工智能语音初创公司 ElevenLabs 首次为人工智能生成的视频添加音效,让人们了解了其未来的发布计划。

为sora配音的ai生成工具ElevenLabs

ElevenLabs 以其近似人类的文本到语音和合成语音服务而闻名,它为使用 OpenAI 的 Sora 制作的视频添加了人工生成的音效。

OpenAI 上周发布了其令人印象深刻的 Sora 文本到视频人工智能模型,展示了迄今为止最逼真、最一致、最长的人工智能生成视频。
ElevenLabs 表示,它还没有准备好发布其文本-声音特效模型,但一旦上线,它将能够创建包括脚步声、海浪声和环境声在内的各种声音。该公司在 X 上写道:”我们被 Sora 的发布所震撼,但觉得它还需要点什么…… 如果你能用人工智能来描述一种声音并生成它,会怎么样呢?

这段网络疯传的sora生成视频的配音由ElevenLabs制作

ElevenLabs 公司成立于 2022 年,被认为能制作出最逼真的合成语音,生成的语音足够接近自然,几乎无法察觉。

今年年初,这家总部位于英国的初创公司完成了价值 8000 万美元的 B 轮融资,成为价值十亿美元的独角兽企业。在宣布新一轮融资的同时,该公司还推出了一款新工具,用于在视频中同步人工智能语音,以实现自动翻译,进军国际配音市场。

市场上已经有一些文本到特效的模型,通常是围绕音乐人工智能模型建立的,包括 myEdit、AudioGen 和 StabilityAI 的 Stable Audio。ElevenLabs 提供的声音似乎是最自然的。

目前还不清楚文本到声音特效模型将于何时推出,但 ElevenLabs 已经发布了一个等待注册列表,要求输入 “您可能用来创建声音的提示”。

这对人工智能视频意味着什么?
下一阶段可能会出现一些工具,它们可以分析视频内容,并在正确的位置自动添加音效。这同样适用于音乐。目前,大多数人工智能音乐工具都是从文本到音乐,但未来随着多模态技术的发展,它们可以从图像或视频开始。

为sora配音的ai生成工具ElevenLabs

生成式人工智能的梦想之一,就是能够根据一个提示创建完整、全面的内容。

目前,这还只是一个梦想,更不用说接近现实了,但随着文本到特效、改进的人工智能视频和合成语音等技术的进步,梦想正在一步步变为现实。

发布者:ai发烧友,转转请注明出处:http://www.ouzou.cn/ai-jishu/4331.html

(0)
ai发烧友的头像ai发烧友
上一篇 2024-02-17 下午9:50
下一篇 2024-02-26 上午12:01

相关推荐

  • LG在2024年CES上推出一款智能家居双足机器人

    在2024年的国际消费电子展(CES)上,LG推出了一个引人注目的智能家居双足机器人。这款机器人以其憨态可掬的外观和先进的功能吸引了众多参观者的关注。 从外观设计上看,这款双足机器人拥有圆润的身形和大眼睛,看起来非常可爱和亲切。它的“耳朵”部分设计得仿佛佩戴了耳机,增添了一丝时尚感。这种外观设计不仅使机器人看起来更加友好,还有助于减少用户在使用过程中的陌生感…

    2024-01-13
    01
  • AlphaTensor-Quantum 算法:人工智能可以优化量子电路

    电路优化是未来大规模开发容错量子计算机的关键挑战。一种被称为 T 门的量子门是实现这一目标的障碍,因为它们的计算成本很高。人工智能可以解决这个问题,最大限度地减少实现特定量子电路所需的 T 门数量。 量子计算公司Quantinuum的研究人员与谷歌DeepMind的同行合作,研究人工智能模型能否帮助大规模减少T门的数量(注:T门(T-gate)是量子计算中的…

    2024-02-28
    00
  • 人工智能与技术殖民主义的风险

    在人工智能快速发展的时代,生成式人工智能(GenAI)的出现标志着一个关键的转折点,使我们稳步迈向技术殖民主义。这一重大转变超越了传统的技术进步,深刻地影响了我们的社会和文化景观。 GenAI 是一种基础模型,本质上是一种预先训练的深度学习模型,擅长吸收反映广泛人类知识和行为的大量数据集。这种能力改变了人工智能,使其能够承担以前认为无法完成的任务,例如生成复…

    2024-02-07
    00
  • 谷歌Mobile Diffusion:让AI艺术跃上移动设备

    摘要:谷歌的5.2亿参数模型可以直接在智能手机和其他移动设备上实现人工智能艺术生成;Mobile Diffusion利用了生成式人工智能的下一个趋势:边缘计算。 谷歌研究人员已经开发了一种文本到图像的AI模型,该模型可以在移动设备上利用边缘计算生成高质量图像。 这个恰如其分地被命名为Mobile Diffusion的模型非常微小,它可以快速创建512&#21…

    2024-02-04
    00
  • Neuro AI:利用人脑推动人工智能发展

    世界上最复杂的计算机是人类的大脑。这块由脂肪、水、蛋白质、碳水化合物、盐和神经元组成的聚合物比任何迄今为止的人工智能系统都更复杂。了解它的工作原理,可能是解锁下一代人工智能的关键。 世界人工智能戛纳节的专家似乎也这样认为。他们称之为神经人工智能的概念指的是我们的大脑如何从例子和先前的经验中学习,这可能比仅仅用不断增加的数据来训练AI任务更先进。 鲁尔大学博鲁…

    2024-02-11
    00

发表回复

您的电子邮箱地址不会被公开。 必填项已用 * 标注