人工智能遇上量子:ai模型将拥有“理解”能力

能够理解世界而不仅仅是生成一个单词或代码的人工智能系统是许多人工智能研究人员的梦想。

人工智能遇上量子:ai模型将拥有“理解”能力

一群量子计算科学家开发了一种新方法,使梦想更近了一步:他们开发了一个框架,使机器能够像人类一样学习。

Quantinuum 团队的一篇新论文描述了该框架,该框架可以让人工智能系统学习形状和颜色等概念。机器不仅可以看到图像并识别它,而且还可以真正理解该物体的​​含义。

他们开发了组合量子框架,旨在通过经典和量子计算方法从数据中自动构建和学习概念。

使用一种称为“范畴论”的数学类型,利用图形演算来表示对象和态射,对象被描述为标记线,态射被描述为连接这些线的盒子,从而可以直观地理解复杂的操作。

简而言之,研究人员本质上将量子计算的见解与认知科学概念相结合,创建了一个框架,该框架提供了数学结构,使人工智能系统能够可视化动作。

Quantinuum 将这一概念应用于图像识别,证明形状、颜色、大小和位置等概念可以传授给接受过形状图像训练的系统。

Quantinuum 的框架将概念分解为更简单的部分,以便系统可以看到它们如何相互关联和交互——就像一张详细的地图。

通过提高机器理解动作或概念的能力,Quantinuum 团队希望这项研究能够为推进不仅可以预测而且可以理解的人工智能系统做出贡献。

人工智能领域的顶尖人才希望超越生成式人工智能,创造出更强大的系统。最近,Meta 的 Yann LeCun 发表了一次演讲,他表示应该放弃生成式人工智能,重点关注创建能够理解周围世界的ai系统。

Quantinuum 的研究团队也希望实现这一目标——但为了问责制的目的。他们认为,当前的大型语言模型本质上是黑匣子,用户无法检查其底层工作原理。

“在当前人工智能领域谈论问责制和透明度的环境下,我们拥有一系列真正重要的研究,这将从根本上影响下一代人工智能系统。这将比许多人预期的更早发生”,Quantinuum 创始人伊利亚斯·汗 (Ilyas Khan) 说道。

Quantinuum 虽然主要是一家量子计算公司,但在开展人工智能相关研究方面有着悠久的历史。这项最新工作的重点是人工智能系统的可解释性,该公司希望有助于构建ai安全系统。

“人工智能有能力造成严重伤害,同时也带来巨大好处。用户了解系统做出决策的原因至关重要。当我们读到和听到人工智能系统的‘安全问题’时,可解释性和问责制是关键问题,”公司博客文章写道。

Quantinuum 的框架可以在经典计算机和量子机器上运行,论文称后者系统更自然地适合解决范畴论等概念。

组合量子框架还处于早期阶段,其背后的团队表示,它需要“进一步的大量工作”来证明它可以应用于人工智能代理等应用程序。

发布者:ai发烧友,转转请注明出处:http://www.ouzou.cn/ai-jishu/4327.html

(0)
ai发烧友的头像ai发烧友
上一篇 2024-02-16 下午9:24
下一篇 2024-02-21 下午11:54

相关推荐

  • 腾讯发布多模态音乐模型 M2UGen

    1月3日讯,据 GitHub 页面显示,腾讯联手新加坡国立大学推出一款多模态大模型 M2UGen,具备音乐理解和生成能力。 研究团队表示,M2UGen 模型可以回答音乐相关的问题,还可以已通过文本、图像、视频和音频等多媒体渠道生成音乐,并对音乐进行编辑。该模型利用 MERT 等编码器(用于音乐理解)、ViT(用于图像理解)和 ViViT(用于视频理解),以及…

    2024-01-03
    00
  • Google Chrome浏览器新增人工智能生成功能

    Google今天宣布,计划在最新版的 Mac 版 Chrome 浏览器(M121)中添加实验性的生成式人工智能功能,帮助用户组织标签页、创建主题和起草内容。标签管理器能够根据打开的标签建议和创建标签组,右键单击标签并选择”组织类似标签”选项即可访问该选项。 通过文本到图像的扩散模型,Chrome 浏览器用户可以根据主题、情绪、视觉风格…

    2024-01-24
    00
  • Google推出了一款可从简短文本生成逼真视频的新型ai模型Lumiere

    Lumiere创建的视频展示了逼真的运动,甚至可以使用图像和其他视频作为输入来改善结果。在题为《用于视频生成的时空扩散模型》的论文中揭示,Lumiere的工作方式与现有的视频生成模型不同。它一次性生成视频的时间持续,而现有的模型则通过合成关键帧,然后进行时间超分辨率。 简单来说,Lumiere关注图像中物体的运动,而以前的系统则通过已经发生运动的关键帧进行拼…

    2024-01-30
    00
  • 如何使用 Google Gemini ?

    了解如何使用 Google Gemini 可以让您更深入地了解 AI 的工作原理。 Gemini 是 Google 对 ChatGPT 和 Microsoft Copilot 的回应,由早期实验性聊天机器人 Bard 更名而来。 它建立在 Gemini 系列人工智能模型之上,不断更新新功能,包括图像生成和运行代码的能力。 虽然 Gemini 最初是一个纯文本…

    2024-02-26
    00
  • OpenAI推出文生视频新模型sora,可生成长达1分钟视频

    OpenAI 凭借 Chat-GPT 及其文本转图像生成器 DALL-E 席卷了人工智能世界,并通过新的文本转视频sora平台加大了赌注。 这家科技巨头周四(2 月 15 日)推出了 Sora。它是一款基于人工智能的文本到视频生成器,允许用户仅使用文本提示即可创建长达一分钟的视频。 Sora 由一个简单的文本框提供支持,允许用户输入他们想要的任何文本提示。然…

    2024-02-16
    00

发表回复

您的电子邮箱地址不会被公开。 必填项已用 * 标注