最佳体验请使用Chrome67及以上版本、火狐、Edge、Safari浏览器 ×

创建银行
创建开票

    世界上最大的芯片创下 AI 速度记录,超越 NVIDIA,发来贺电

    作者:张亮@芯速配 阅读30 2025/05/29 13:52:14 文章 原创 公开

    世界上最大的芯片创下 AI 速度记录,超越 NVIDIA

    发来贺电,今天我亲手握住了世界上最大的计算机芯片。虽然它的体积令人印象深刻,但其速度更为惊人,也更为重要。大多数计算机芯片都很小,只有邮票大小甚至更小。相比之下, Cerebras WSE (Wafer Scale Engine) 是一个巨大正方形,每边长 8.5 英寸或 22 厘米,而最新型号在单个芯片上拥有惊人的 40 亿个晶体管。正是因为有了这数十亿个晶体管,WSE 才创造了 AI 推理操作的世界速度记录,比一个大体上性能相当的 NVIDIA 集群快约 2.5 倍。

    “这是全球最快的推理速度,” Cerebras 首席信息安全官 Naor Penso 今天在温哥华 Web Summit 上对我说。 “上周 NVIDIA 宣布在 Llama 4 上实现了每秒 1,000 个 token 的速度,这令人印象深刻。而我们今天刚刚发布的基准测试达到了每秒 2,500 个 token。”

    如果你对这些概念感到陌生,可以把“推理”理解为思考或行动:根据你的输入或提示构建句子、图像或视频。把“token”看作思维的基本单元:一个单词、一个字符或一个符号。

    AI 引擎每秒能处理的 token 越多,它返回结果的速度也就越快。而速度至关重要。也许对你个人来说意义不大,但当企业客户希望在购物车中加入 AI 引擎,以便即时告诉你只需再加一种配料就能做出完美的韩式烧烤牛肉塔可时,他们必须能够为成千上万的人迅速提供服务。

    有趣的是,速度即将变得更加关键。

    我们正迈入一个代理时代,届时 AI 将能为我们执行复杂的多步骤任务,例如规划并预订去奥斯汀观看一级方程式比赛的周末旅行。代理并非魔法:他们对待大任务的方式和你一样……一步一步来。也就是说,需要将一个庞大的任务分解为 40、50 或甚至 100 个子任务,这就意味着工作量会大幅增加。

    “AI 代理需要处理更多的工作,而且各个任务之间需要相互通信,” Penso 告诉我。 “你不能忍受推理速度缓慢。”


    声明:本网站部分内容来源于网络,版权归原权利人所有,其观点不代表本网站立场;本网站视频或图片制作权归当前商户及其作者,涉及未经授权的制作均须标记“样稿”。如内容侵犯了您相关权利,请及时联系责任编辑(资讯公告)
    刘宗盛
    @芯速配
    成员
    • 成交数 --
    • 成交额 --
    • 应答率
    聊天 收藏 点赞
    ¥0.00¥0.00¥0.00¥0.00¥0.00
     0  0
    
    
    分享

    微信扫一扫:分享

    微信里点“+”,扫一扫二维码

    便可将本文分享至朋友圈。

        0
      验证
      二维码支付