Grok4太强了，研究生水平碾压PhD，马斯克豪赌AGI

admin AI新闻 2026-06-11 17

这是一场停不下来的豪赌。

Grok4真的很强

Grok4太强了，研究生水平碾压PhD，马斯克豪赌AGI-第1张图片-开云app在线下载-开云体云app官网入口下载-V3.6.9

近期, 马斯克发布了号称“世界上最强的 AI 模型”, 于此, 有人直接说道, AGI 在此现已经达成了。xAI发布了两个版本, 一个是 Grok 4, 另一个是 Grok 4 Heavy, 且它们均为推理模型, 前边这个是单代理版本, 而后者则是多代理版本, 此种版本能够容许四个代理一块儿开展工作。

“Grok 4 于所有学科领域均取得了达到研究生水准的成果, 甚至在程度上超越了多数 PhD 的表现。”于直播延迟 1 小时之后, 马斯克率先针对 Grok 最新一代的水平作出了这般定位。

除于SAT、GRE考试之中斩获近乎完美之成绩外, 在「人类终极考试（HLE）」测试里, 此刻Grok 4之得分高于Gemini 2.5 Pro、o3, 而言Grok 4 Heavy版本竟突破了40%, 较之以中文处理见长之Kimi, Grok4之作多语言支持更为周全, 特别于英语与编码混合任务里占先, Kimi虽具速度, 然而Grok4之深度思考能力令其于科研场景内更具可靠性。

Grok4太强了，研究生水平碾压PhD，马斯克豪赌AGI-第2张图片-开云app在线下载-开云体云app官网入口下载-V3.6.9

在编码以及软件工程范围之内, SWE - Bench基准方面, Grok4约60%以上, 此比例高于GPT - 4.5的54.6%, 高于Gemini 2.5 Pro的类似分数。Claude 4尽管达到了72.7%, 然而Grok4在代码分析以及bug修复方面更为高效, 其识别准确率达到89%。与Kimi进行比较时, Grok4的工具使用原生集成, 这使得它在编程自动化方面更为流畅, 适合开发者使用。

xAI团队于直播里透露, Grok 4的训练量是Grok 2的100倍, 在强化学习也就是RL阶段所投入的算力, 比市面上其他任何模型的10倍还要多。发布会作出介绍, Grok 4的订阅费是30美元每月, 更为强大的Grok 4 Heavy版本的费用是300美元每月, Grok 3保持免费开放。

马斯克持有这样的看法, Grok4此次更新所设定的目标是, 要成为那种尽可能去追逐真相的AI , 他还进行过这样的设想, 借助该模型与类人机器人相互结合, 在今年年末或者明年的时候发现全新的技术开云正版app下载开云app在线入口开云app官方最新下载地址开云真人app,开云真人app地址，甚至是全新的物理定律 , “这会给人带来那种既觉得兴奋又有着紧张之感, 我期望自己能够存活到亲眼见证它诞生的那一刻。”马斯克如此说道。

然而, 就当前体验过的博主所给出的评价而言, 评价呈现出极为明显的两极分化态势。有部分网友觉得, 多代理投票确实具备准确性, 只不过它一方面操作速度迟缓, 另一方面耗费资金较多。Grok 4并非毫无敌手那般无敌, 在图像理解以及生成这两方面, 它依旧逊色于OpenAI、Anthropic等竞争对方。也存在另外一些人持有这样的观点, 即在现阶段, AI唯有价格高昂才能够保证品质优良, 如同DeepseeK R1那样, 在后续展开推广工作之后能够达成这一目标, 而眼下最为关键紧要的事情, 便是推出更为强大的AI去占据市场份额。

xAI大力出奇迹但维持不易 01 烧钱，马斯克是专业的

以往, 存在一种说法, 即要是创业者没有10亿美元, 那就别参与大模型创业, 过去, 国内外总有一些创业者对此不服气, 然而, 几年时间过去, 我们发现, “六小龙”的说法不再那么热门了, 国外呢, 除了OpenAI, 剩下的就是大厂的模型, 而如今, 这一门槛已被马斯克最高拉高到“月销10亿美元”。

上月, 有外媒透露了相关情况, 原因是xAI在进行研发尖端AI 模型这项工作, 同时还在构建数据中心, 另外还采购了专用芯片, 其每月支出竟然高达10亿美元, 财务预测表明, 在2024 年的时候, 总支出预计能够达到130亿美元, 然而营收仅仅只有5亿美元, 到2026年, 营收或许可以增长到20亿美元, 可是依旧难以覆盖成本缺口。

Grok4太强了，研究生水平碾压PhD，马斯克豪赌AGI-第3张图片-开云app在线下载-开云体云app官网入口下载-V3.6.9

xAI的财务需求主要源自其激进的硬件战略, 与依赖租赁算力的竞争对手情形不一样, xAI坚持自行建设基础设施, 马斯克甚至宣告计划来打造一台配备100万个英伟达Blackwell GPU的超级计算机, 预计要耗费50亿至625亿美元（约合人民币4500亿元）, 有希望成为历史上最为昂贵的AI基础设施项目。

有分析师觉得, 马斯克正实施一种“烧钱来换取领先地位”的策略, 想要借助大规模筹集资金、进行硬件方面的投入以及快速地更新换代, 在人工智能的军备竞赛里超过OpenAI、Anthropic以及Google DeepMind。可是, 能不能在资金用光之前达成技术上的突破, 依旧是个不确定的情况。

单单硬件成本居高不下是一方面, xAI于数据训练层面也是别具一格, 运用了合成数据训练这种方式, 先是借助AI产出数据, 而后将其用于模型训练, 其成本要比同行高得多。它的训练数据集总量大概是4万亿tokens, 采用新的MinHash - GPU管道开展去重, 近似重复率。

虽合成数据不错, 可要晓得, 其会出现幻觉过高之状况, 在数据被反复利用了过后, 就会出现“以讹传讹”情形, 进而致使更大错误产生。也许这跟合成数据存在关联, 当下在Grok上面, 于询问诸多问题之际, 会优先去思量马斯克的观点了。大量X用户所发布的实测结果同样表明, 的确存有这一倾向, 就好比在数据科学家Jeremy Howard发布的一段视频之时, Grok在思维链中清楚表明, 正就马斯克的观点予以考虑。不可否认马斯克确实是极为厉害的人物, 然而在近些年他发表了好些“涉及政治引发争议的言论”, 进而导致存在了“抵制马斯克”这样的活动。在大模型里过度倾向某一个人物很明显势必会给平台造成不小的竞争方面的问题。

除了这个之外, 另外还有一点呢是被大多数人给忽略掉的。xAI负有马斯克在收购推特的时候所产生的一些银行方面的债务, 在年初的时候xAI是以全股票交易的这种方式去收购了X也就是推特, 对X进行的估值是330亿美元。与此同时呢xAI也承担了X之前的债务。

马斯克在一方面, 已然对部分银行的高息债进行了置换, 在另一方面, 期望借助推高估值这一方式而去缓解资金方面存在的压力。有媒体作出报道, 而这报道所涉及的内容是, xAI马上就要开启第三次具备大规模性质的融资, 其目标估值直接朝向2000亿美元。

据了解, 此次有关融资的谈判已然进入到了初步的阶段, 速度最快的话将会在下一个月之时予以启动。这一回将会构成xAI在时间跨度不到两个月的情况之内所开展的第三次规模颇大的融资活动: 在今年的6月份期间, 借助二级股票发行的方式成功筹集到了300亿美元之多的资金；到了7月分的时候, 则是通过贷款以及现金投资的途径获取到了额度为100亿美元的资金。

当然, 从更大的层面去瞧, 马斯克眼中所对标的是OpenAI, 既然OpenAI都能够估值3000亿美元, 那么xAI估值2000亿美元那是只低不会高。更何况, 马斯克向来都觉得xAI才是能够实现真正AGI的企业, 至于它能值多少钱, 那可就要看马斯克的吆喝。

02 长期领先异常困难

上半年, 大模型发展在整体上, 正从“规模竞赛”转向“效率与场景深耕”的时候, 涌现出了不少模型, 这些模型在架构创新方面、在训练效率方面、以及在多模态能力方面, 有着突破性表现。比方说, Claude4代码生成能力领先于行业, 它支持20万token输入, 从而成为开发者首选。还有Gemini2.5Pro, 它拥有业内最长处理能力, 最高支持200万token上下文。当然啦, DeepSeek R1在全世界刮起一阵旋风, 使得低成本和高质量成为可能。

反过来讲, 今年2月份所发布的Grok3, 在起始阶段仅仅是各类跑分呈现“屠榜”态势, 然而, 最终留存下来的印象, 却唯有大尺度的聊天内容而已, 并且, 也并未像马斯克所期望的那样, 促使Grok用户实现大幅增长。故而, 马斯克需要规模巨大的成果, 以此来证明xAI并非已经过时, 不再跟得上时代步伐。

此前, 马斯克于X上频繁为Grok模型进行预热, 然而, Grok 3.5模型最终出现跳票情况, 这一现象一时间引发了众人对于该模型能力的怀疑。在4月底的时候, 马斯克便已在X上作出预告, 声称Grok 3.5Beta版将于下周上线, 其主打专业问答能力, 尤其是针对工程、编程类问题。可是, 一直到5月中旬, 马斯克才出面回应称, “目前还有点粗糙, 需要再打磨一周。”在6月27日, 马斯克又一次提及Grok, 表明正在与xAI团队通宵进行模型打磨, 且进展状况良好, 即将发布的模型被命名为Grok 4。也就是说, 马斯克跟团队做出选择, 跳过Grok 3.5, “端”出更高的迭代版本, 针对模型跳票之后外界有的质疑, 这看起来是一个很好的挽救方案。

今年新发布的模型, 几乎都是至少拥有一项或者多项跑分超过GPT模型的, 这背后蕴含的道理并不难理解, 那便是现如今模型之间的差异仅存在数量级, 不存在指数级, 也就是说, OpenAI的大模型虽具备先发优势, 然而其他几家大模型同样各有长处, 彼此你追我赶, OpenAI的GPT大模型并未形成绝对的优势。

马化腾曾讲过, AI技术以及应用是一条特别长的赛道, 各个公司之间的竞争与发展更像是一场马拉松比赛, 而并非短跑, 暂时出现的领先与落后什么问题也说明不了。

Grok4太强了，研究生水平碾压PhD，马斯克豪赌AGI-第4张图片-开云app在线下载-开云体云app官网入口下载-V3.6.9

马斯克所讲的那真正形成完整形态的AI或者AGI, 更像是一种用于争抢AI定义权的言辞。微软所认定的AGI是指能够带来超过1000亿美元利润的, 并且会对行业引发具有重塑性质变革的。马斯克觉得Grok有可能在今年年末发现新的可运用的技术, 在明年发现新的物理学知识, 还能够深度介入特斯拉制造以及擎天柱机器人的大脑设计。

但是, 到底什么才是真正的AGI, 这一点存在着争议, 又怎么能谈论实现真正的AGI的事情呢? xAI当前的状况有点类似马斯克以往所有创业呈现出的“复刻”版本, 在前期的时候, 疯狂地投入资金, 疯狂地去拉取融资, 大胆地描绘前景, 之后再看能不能押中未来。然而, 在如今的AI领域竞争环境里, 仅仅有激情以及资金是远远不够的, 还必须得拥有真正具备实力的产品以及能够落实到实际应用中的能力。

03 马斯克打算怎么做

哪怕此次Grok 4曾有过短暂的领先情形, 然而到了今年夏天的时候, OpenAI也会发布其最新旗舰模型GPT-5, 至于这一领先所具有的优势能够维持多长时间是无法确定的。海外的大厂针对AI模型同样是势在必得, 微软、亚马逊、谷歌以及Meta这四大巨头, 去年的总资本支出达到了2300亿美元, 到了2025年这些公司的投资计划竟然高达3200亿美元, 在财报里管理层都纷纷表明, 自己计划增加针对AI技术以及数据中心建设方面的投资。

如此一来, 便需思索马斯克的优势究竟是什么, 是拥有财富吗? 显然并非如此, 几家大型企业同样毫不逊色, 马斯克的优势在于借由特斯拉以及X搭建而成的商业帝国。上次对X的收购为xAI带来了两大核心优势: 其一为数据资源, X平台所具备的海量用户帖子以及机器人生成内容, 能够直接用以训练Grok, 从而省去高昂的外部数据采购成本；其二是算力共享, X先前采购的AI芯片集群, 如今由xAI进行调配使用, 进而进一步削减硬件投入。

Grok4太强了，研究生水平碾压PhD，马斯克豪赌AGI-第5张图片-开云app在线下载-开云体云app官网入口下载-V3.6.9

xAI向投资者作出承诺, 该公司会在2027年达成盈利的目标。摩根士丹利进行了预测, 指出其在2029年的收入有可能突破130亿美元。要是这种情况真的发生, xAI将会比竞争对手OpenAI早两年进入盈利阶段, 而OpenAI预计最早要到2029年才可以实现正现金流。

然而, 此一乐观预估是基于多项假设作为支撑的: 其一, Grok能够迅速广泛流行起来, 并且深入地融合到X平台当中；其二, 能够顺利地开辟出企业级AI工具的市场领域；其三, 与特斯拉的自动驾驶等业务共同协作得以实际落地实施。当下, xAI的营收基本上全部依靠X Premium订阅服务, 在2024年所预期的收入仅仅只有5亿美元, 远远无法抵补运营成本。对照来看, OpenAI在2024年预测会有127亿美元的营收, GPT的用户数量超过了1亿, 并且深度嵌入到了微软的生态之中, 然而Grok的活跃用户仅仅只有两千万人, Anthropic等竞争对手也在加快商业化的进程。

写在最后

马斯克再度如往昔那般开启又一场新的豪赌, 此豪赌具备高杠杆的特性, 有着高风险的状况, 同时伴有高回报的可能。按照基本面去分析xAI, 那结果无疑是惨淡的, 故而应当停止疯狂烧钱, 然而, 只因它是马斯克的xAI, 所以关于未来的宏大构想似乎又变得可信了。

参考资料：

马斯克发布“地球最强AI模型” 来源：CSDN

标签： Grok4 马斯克 AGI xAI AI模型