AI初创公司Groq–自研LPU速度碾压英伟达GPU

人工智能能为人类做什么、可能做什么以及未来几年会做什么,我们还只是窥其皮毛,Groq 希望成为这场革命的中心。

语言处理单元(LPU)是Groq的赚钱利器,它是一种新型芯片,不是用于训练人工智能模型,而是用于快速运行这些模型;在 Groq 上运行大模型的推理速度,较英伟达 GPU 提高 10 倍,而成本只有其十分之一。

AI初创公司Groq–自研LPU速度碾压英伟达GPU

GroqChip 目前是一款 14 纳米制程的处理器,其性能得益于规模优势,可在云中作为结构良好的单元集群高效解析数据。

Groq 的 LPU 不需要像 Nvidia GPU 那样快速的数据传输。与利用高带宽内存(HBM)的 GPU 不同,Groq 的 LPU 利用 SRAM 进行数据处理,其速度比 GPU 所用的存储器快约20倍。
获得延迟极低的人工智能推理能力有助于消除人工智能解决方案交付过程中的一些瓶颈。例如,文本到语音和反向语音可以实时进行,从而实现与人工智能助手的自然对话,包括允许您打断它。

许多试图在人工智能领域与 Nvidia 竞争的公司都在追逐训练市场,但 Groq 决定专注于运行模型。

“我们一直专注于提供无与伦比的推理速度和低延迟,”Groq 首席布道师马克-希普(Mark Heap)在与 Tom’s Guide 对话时解释道。”在生成式人工智能应用变得无处不在的今天,这一点至关重要。”

这些芯片由 Groq 创始人兼首席执行官乔纳森-罗斯(Jonathan Ross)设计,他还领导了谷歌用于训练和运行Gemini的张量处理单元(TPU)的开发。

Heaps解释说,它的工作原理更像是一个规划好的网格化城市,交通参与者知道该往哪里走,可以很容易地按照布局行驶,而其他芯片就像是在德里开车,道路布局复杂,交通繁忙。

AI初创公司Groq–自研LPU速度碾压英伟达GPU

“我们的架构允许我们在不牺牲速度或效率的情况下横向扩展… 对于处理密集型人工智能任务而言,这将改变游戏规则。
公司的建立基于一系列核心支柱,包括解决延迟问题,同时确保整个项目的可扩展性。这主要是通过公司自己的云基础设施实现的,更多的全球数据中心将在今年或明年上线。

虽然无人驾驶汽车等边缘设备可能会在第二版将芯片缩小到 4 纳米后变得可行,但目前的重点纯粹是云。

这包括通过 API 为第三方开发者提供高速、可靠地访问 Mistral 或 Meta 等开源模型的途径。此外,还有一个直接面向消费者的聊天机器人界面,名为 GroqChat。

正是这个公开且易于访问的界面的推出,似乎将这家成立六年的公司推向了舆论的风口浪尖。他们一直在后台工作,包括在 Covid 大流行期间为实验室提供快速数据处理,但这是一个关键时刻。
Heaps和乔纳森-罗斯讨论的结果是 “我们为什么不直接把它放上去,让大家都能试试”。在此之前,GroqChips 曾在公司内部试验过在 GroqChips 上运行 Llama 2 和 Mixtral 等开源模型。

AI初创公司Groq–自研LPU速度碾压英伟达GPU

罗斯告诉团队把它作为主页。从表面上看,这是人们访问 Groq 网站时首先看到的内容。”这有点吓人,”Heaps 承认。”他的目标是 我希望网站上没有营销页面。我只希望是聊天。” 于是,他们就这样实施了。


利用低延迟ai可以做什么?

AI初创公司Groq–自研LPU速度碾压英伟达GPU

低延迟人工智能可实现真正的实时生成。目前的重点是大型语言模型,包括代码和文本。我们看到每秒可生成多达 500 个词组,这比人类的阅读速度快几十倍,即使是复杂的查询也是如此。

很快就会有新的模型加入,但随后他们将致力于提供同样快速的图像、音频甚至视频生成。这才是真正的优势所在,包括在高分辨率下也能实时生成图像。

另一个显著优势是能够从一个大的上下文窗口中找到一条信息,不过这是在未来的版本中,你甚至可以对模型进行实时微调,从人机交互中学习并调整。

这样就可以实现真正的开放世界游戏,类似于欧内斯特-克莱恩(Ernest Cline)的开创性小说《玩家一号》(Ready Player One)中的 “绿洲”。实时的人工智能渲染和再训练可以实现所需的适应性,以反映来自多个玩家的大量互动和变化。
Groq公司自2016年成立以来,前几年的大部分时间都在完善技术。这包括与实验室和公司合作,加快复杂机器学习任务(如药物发现或流动动力学)的运行时间。

运行 LLM 的转折点与 ChatGPT 的兴起以及 Meta 的 Llama 大型语言模型的泄露不谋而合。

我们可以预见的一点是,这个技术已经在颠覆整个ai技术领域。我们看到人工智能个人电脑和本地硬件的兴起,但随着互联网连接的改善和延迟问题的解决,它们还需要吗?

发布者:ai发烧友,转转请注明出处:http://www.ouzou.cn/ai-jishu/4363.html

(0)
ai发烧友的头像ai发烧友
上一篇 2024-02-26 下午11:05
下一篇 2024-02-28 下午11:13

相关推荐

  • OpenAI正在谈判投资机器人初创公司Figure:准备生产ChatGPT机器人?

    微软和OpenAI正在商谈对人形机器人初创公司Figure进行投资,这可能最终实现机器人能够执行对人类来说比较危险的工作。 彭博社首次报道了这次潜在的投资,可能会筹集到5亿美元,来自一系列投资者。这将使Figure的估值达到19亿美元或更高,具体取决于筹集的资金。 交易尚未最终确定,这些报道来自与计划密切相关的匿名消息源。这对于OpenAI来说是一个合乎逻辑…

    2024-01-31
    00
  • 如何利用MidJourney创作漫画和动漫?

    MidJourney公司推出了一款专门针对动漫和漫画艺术进行了精细调整的图像模型。Niji v6滤镜适用于版本6,并允许您创建自己的艺术作品。 MidJourney v6的Alpha版本于去年12月首次推出,并自首次发布以来进行了一系列升级。 除了新的精细调整模型之外,您现在还可以在生成的图像中进行缩放,移动到下一帧并使用修补功能更改区域。 Niji v6允…

    2024-02-01
    00
  • Google Chrome浏览器新增人工智能生成功能

    Google今天宣布,计划在最新版的 Mac 版 Chrome 浏览器(M121)中添加实验性的生成式人工智能功能,帮助用户组织标签页、创建主题和起草内容。标签管理器能够根据打开的标签建议和创建标签组,右键单击标签并选择”组织类似标签”选项即可访问该选项。 通过文本到图像的扩散模型,Chrome 浏览器用户可以根据主题、情绪、视觉风格…

    2024-01-24
    00
  • IMF:AI将影响全球近40%的就业岗位,人工智能引领行业变革

    据香港《南华早报》15日报道,当地时间1月14日,国际货币基金组织(IMF)总裁格奥尔基耶娃在参加瑞士达沃斯世界经济论坛前表示,全球40%的就业机会将受到人工智能(AI)的影响。 国际货币基金组织(IMF)发布的《Gen-AI:人工智能与未来的工作》报告指出,人工智能的发展将对全球就业市场产生广泛而深远的影响。报告称,在发达经济体和部分新兴市场经济体中,将有…

    2024-01-15
    01
  • 麻省理工和IBM研究报告认为:人工智能自动化将逐步实现且不会导致大规模失业

    麻省理工学院的研究团队联合IBM商业价值研究所进行的一项新研究深入探讨了人工智能对就业市场的影响,挑战了人工智能可能导致大规模失业的一种普遍观念。 目前,对于工作场所中人工智能的研究主要集中在量化其在各个行业中潜在应用的各种可能性上。然而,这项研究关注了人工智能在工作场所自动执行任务的经济可行性,特别关注了计算机视觉领域。 研究人员表示,他们采用的三方分析模…

    2024-01-26
    00

发表回复

您的电子邮箱地址不会被公开。 必填项已用 * 标注