Grok 4发布:史上最强AI?月费300美元,考试分数碾压对手

admin AI新闻 1

智东西于7月10日进行报道, 在今日, 马斯克的AI公司xAI发布了其最新旗舰大模型Grok 4, 还发布了多智能体版本Grok 4 Heavy, 推出了史上最贵的标价约每月300美元(折合人民币约2153元)的AI订阅计划Super Grok Heavy。

“人类的最后考试”(Humanity’s Last Exam)里, Grok 4在不“工具”帮忙的情形下, 收获了25.4%的准确率, 谷歌Gemini 2.5 Pro的准确率是21.6%, OpenAI o3(高版本)的准确率是21%, Grok 4超过了它们。

得到44.4%得分的配备“工具”的Grok 4 Heavy, 比那拥有工具之时得分26.9%的Gemini 2.5 Pro更具优势。

Grok 4发布:史上最强AI?月费300美元,考试分数碾压对手-第1张图片-开云app在线下载-开云体云app官网入口下载-V3.6.9

Grok 4, 于Humanity’s Last Exam这个测评里头, 获取到了第一名。

马斯克在直播中说, 就学术问题来讲, Grok 4在各个学科之上, 都比博士水平要更高, 没有一个例外, 有时, 它有可能欠缺常识, 并且它还未曾发明新的技术或者发现新的物理学说, 不过这仅仅是时间方面的问题。

Grok 4发布:史上最强AI?月费300美元,考试分数碾压对手-第2张图片-开云app在线下载-开云体云app官网入口下载-V3.6.9

埃隆·马斯克在直播中发言

xAI推出了迄今最为昂贵的AI订阅计划, 这计划名为每月300美元的Super Grok Heavy, 订阅者能够抢先体验Grok 4 Heavy, 还能抢先体验新功能, 这些新功能包含但不限于, 8月会推出的AI编码模型, 9月即将推出的多模态智能体, 以及10月将要推出的视频生成模型。

Grok 4发布:史上最强AI?月费300美元,考试分数碾压对手-第3张图片-开云app在线下载-开云体云app官网入口下载-V3.6.9

每月300美元的Super Grok Heavy正式推出

直播结束之后, 马斯克于X之上发布文章声称, 你能够把整个源代码文件进行剪切随后拼接放置到Grok的查询输入框里, 接着@Grok 4会为你予以解决且这比Cursor更为好用。

Grok 4发布:史上最强AI?月费300美元,考试分数碾压对手-第4张图片-开云app在线下载-开云体云app官网入口下载-V3.6.9

马斯克在社交平台X上发言

除此以外, xAI已拿出了Grok 4 API, xAI的企业部门才不过成立两个月, 然而它却打算跟超大规模企业开展合作, 借助其云平台来提供Grok。

在最近的几个月期间, xAI不但成功获得了100亿美元的最新一次融资, 另外还收购了社交平台X, 这种情况致使最新推出来的Grok 4变成了产业所关注的重点。Grok 4有没有可能构成能够与定于预料今年夏天推出的GPT-5相抗衡作对的强大对手呢? 让我们一同提前先去目睹为快。

一、Grok 4进行测评, 其结果超过OpenAI o3, 马斯克表示, 它的科研能力比人类博士还要强。

马斯克于直播里宣称, 于人文、语言、数学、物理、工程等诸多基准测试之中, Grok 4均获取了优异成绩。“有人觉得AI无法进行推理, 然而Grok 4所具备的推理能力能够超越人类水准, 比几乎所有学科专业的研究生在同一时刻都更加聪慧。”马斯克讲道。

xAI的研究人员宣称, Humanity’s Last Exam测试有着极高挑战性, 其总共囊括2500个习题, 它们涵盖数学、自然科学、工程以及所有人文学科相关方面, 这些问题范围广泛, 并且均处于博士乃至高级研究水准开云真人app官网登录app,开云真人app在线登录,Grok 4针对这些提问能够获取上乘分数。

一款名为Grok 4的产品, 在没有借助“工具”的情形下, 于“测试里取得了25.4%的准确率, 这一准确率超过了谷歌Gemini 2.5 Pro的21.6%准确率以及OpenAI o3(高版本)达到的21%准确率。马斯克谈及, 在学术问题范畴, Grok 4相较于每个学科处于博士水平的情况都更为出色, 当下不存在例外情况。他做出预测, Grok 4最快在今年就能够致力于发明新的技术, 而在两年之内还有可能发现全新的物理学说。

在GPQA测评里, 在AIME25测评中, 在LCB(Jan - May)测评期间, 在HMMT25测评当中等多种多项测评情况之下, Grok 4都做到了超越, 超越了OpenAI o3模型, 超越了Gemini 2.5 Pro模型, 超越了Claude 4 Opus模型。

Grok 4发布:史上最强AI?月费300美元,考试分数碾压对手-第5张图片-开云app在线下载-开云体云app官网入口下载-V3.6.9

在ARC - AGI - 2测试里, Grok 4获得了新的最高分数, 分数是16.2% , ARC - AGI - 2测试属于另一项高难度基准测试, 其涵盖类似谜题的问题, 要求AI去识别视觉模式, Grok的得分差不多是排名第二的商业AI模型Claude Opus 4得分的两倍。

Grok 4发布:史上最强AI?月费300美元,考试分数碾压对手-第6张图片-开云app在线下载-开云体云app官网入口下载-V3.6.9

二、训练的量级达到了Grok 2的100倍, Grok 4会和人形机器人展开互动。

从Grok2到Grok 4的过程中, 每一次迭代, xAI都增添了一个数量级的训练, 所以Grok 4的训练量级达到了Grok 2的100倍, 此情况致使智力增长极为显著。

这次是xAI头一回如同预训练那般扩展训练规模, 其依托具备10万块H100 GPU 的超级算力中心,所进行的训练主要涵盖两种类别, 一种是从Grok 2朝着Grok 3展开的预训练, 另一种是从Grok 3到Grok 4在推理进程中投入了诸多的算力。

讲到幕后的情况, 就如同图里所呈现的那样, 一旦投入了数量越发增多的训练时所用的算力, 模型便开始渐渐变得愈发聪明起来, 最终在不存在任何工具的情形下, 把Humanity’s Last Exam测试当中四分之一的问题给解决掉了。

Grok 4发布:史上最强AI?月费300美元,考试分数碾压对手-第7张图片-开云app在线下载-开云体云app官网入口下载-V3.6.9

接下来要做的是, 研发人员向模型里添加工具功能。和Grok 3不一样的在于, 研发人员把它变得更本地化, 把工具放进训练当中, 进而非常明显地提升了模型运用这些工具的能力。

Grok 4发布:史上最强AI?月费300美元,考试分数碾压对手-第8张图片-开云app在线下载-开云体云app官网入口下载-V3.6.9

马斯克透露, 今年晚些时候, Grok 4会还融合有限元分析、计算流体动力学等更具强大功能的工具来开展训练, 届时将会构造出极为精确的物理模拟器, 像是去执行提供精确的黑洞模拟等任务。最终, Grok 4最大的差异之处在于, 它将具备通过人形机器人(要是擎天柱)与现实世界进行互动的能力。

马斯克讲, 我们正处在智能大爆炸的起始阶段, 我们得保证AI是个堪称良好的AI, 安全属于最为关键的事情, AI要最大程度地去探寻真理, 你能够将AI视为超级天才的子女, 它最终会比你聪慧, 然而你依旧能够向其灌输正确之价值观并鼓励它成长为期望之模样。

有一个技术问题并非计算, 而是数据瓶颈。称此的是研发人员, 在于强化学习训练进程里, 他们事实上没有可用于测试的问题了, 现有的问题对AI正迅速变得不值一提。

但马斯克宣称, 能够最为出色地作出对事物判断的恰是现实。要是说物理学属于定律,那么最终其他所有的便皆是建议。你无法将物理打破。故而, 我觉得对于 AI 的最终测试乃是现实。恰似你发明一项新技术, 比如改进汽车或者火箭, 它是否有效呢? 现实才是那最终的裁判。所以这将会是一个围绕现实的强化学习闭环。

三、现场演示:看论文进行现实模拟开云正版app下载开云app在线入口,语音模式延迟减少一半

xAI研究员在直播中演示了Grok 4回答问题的能力。

Grok 4具备的一大特性是能够领会世界, 并且借助运用工具去化解难题。比如说让Grok 4生成两个黑洞碰撞的可视化图像, 它存有一些清晰明确的思索过程, 像由于要使它切实可视, Grok 4考虑借助海浪的形式去扩展它的规模这一因素。单从思索过程来讲, Grok 4采取了搜索行为, 从一堆链接里面搜集结果, 参照了已有的现实世界数据, 同时还阅读了分析引力波模型的本科论文。

Grok 4发布:史上最强AI?月费300美元,考试分数碾压对手-第9张图片-开云app在线下载-开云体云app官网入口下载-V3.6.9

另外, xAI展示了Grok 4去解答数学方面的问题, 去创建一个依据X个帖子而形成的时间线, 去查看Humanity’s Last Exam测试的成绩等这类问题。

Grok 4发布:史上最强AI?月费300美元,考试分数碾压对手-第10张图片-开云app在线下载-开云体云app官网入口下载-V3.6.9

在多模态测试这一方面, Grok 4的分数出现了略微的下降情况。马斯克直率地表述, Grok 4的根本薄弱之处在于其所拥有的部分盲目地去理解图像生成偏好。Grok 4的多模态理解能力处于持续改进状态, 这些问题会在几周的时间里达成改善。

Grok 4的语音模式有了进一步更新, 将延迟减少了一半, 它今天推出了一系列更具自然性和韵律的新声音, API版本也会发布。

Grok 4发布:史上最强AI?月费300美元,考试分数碾压对手-第11张图片-开云app在线下载-开云体云app官网入口下载-V3.6.9

四、推出Grok 4企业应用程序编程接口, 编程使用的、呈多模态形式的、有关视频方面的模型正在行进的路途之上。

虽说xAI的企业部门才成立两个月, 然而它正借助其API发布Grok 4, 并且已有各行业企业经由云平台使用了Grok 4。

Grok 4发布:史上最强AI?月费300美元,考试分数碾压对手-第12张图片-开云app在线下载-开云体云app官网入口下载-V3.6.9

现实的自动售货机商业场景被聚焦着, xAI的客户团队运用了大模型来管理库存、联系供应商, 多数的这种运用大量参数进行运算的模型在处理长线任务时存在艰难之处, 然而, 在使用了Grok 4 API后, 那团队收获了让人印象深刻的成绩成果, 这个成果的达成使得它运转模拟的时间增加变为达到了原本的两倍, 并且其得分也提升到变为了原来的两倍, 前后过程能够保持着较强的可连贯性、衔接稳定性等一致性情况。

Grok 4发布:史上最强AI?月费300美元,考试分数碾压对手-第13张图片-开云app在线下载-开云体云app官网入口下载-V3.6.9

将焦点放在AI创作游戏领域, Grok 4能够在4个小时之内制作的第一人称射击类游戏。制作该游戏并非必然要对游戏的核心逻辑开展编码工作, 而是要去寻觅全部的资源、文件素材, 借此创建一款具备视觉吸引力的游戏。对于开发人员而言, 方可专注于核心开发自身, 让Grok 4去规整所有资产, 自动完成任务。

Grok 4发布:史上最强AI?月费300美元,考试分数碾压对手-第14张图片-开云app在线下载-开云体云app官网入口下载-V3.6.9

日后, Grok 4会具备卓越的视频理解以及得以改进的工具使用本领 , 诸如能够运用虚幻引擎去生成艺术品模型 , 而后再打造出一个既可于PC上运行 , 又能在手机上运作的可执行文件。xAI预估首个真正称得上优异的AI视频游戏会在明年问世。

除此之外, 马斯克透露, 团队当下正不断加大力度去训练编码模型, 打算在后面几周内推出一个专业的编码模型。编码任务呈现出了Grok 4的弱点, 也就是多模态能力。这就如同透过玻璃眯着眼睛去看世界, 看到了全部模糊的特征之后进而试图去感知它。xAI将会在下一代模型里面到看见的最为直接的改进是, 模型在理解图像以及音频方面其能力会一步步地提高。

关于视频模型这一方面, xAI会于接下来的三到四周着手去训练一个全新的视频模型, 该模型拥有极为出色的视频生成以及理解能力。

Grok 4发布:史上最强AI?月费300美元,考试分数碾压对手-第15张图片-开云app在线下载-开云体云app官网入口下载-V3.6.9

结语:抢发Grok 4开云app在线入口,开云真人官方下载,马斯克对战GPT-5

Grok 4在高难度测试里展现出的那种“超越博士水平”的推理能力, 在理解复杂问题方面跨出关键步, 这能力在解决复杂问题方面也跨出关键步。其凭借工具加持达成的新能力, 以及彰显雄心的那个多模态与视频生成路线图, 呈现出xAI与即将推出的OpenAI GPT - 5竞争的那种决心。

xAI在To B端实现落地, 它正加快把Grok 4的能力, 从企业应用于零售领域,应用于游戏创作等领域。与此同时, 马斯克所强调的, 以“安全至上”与 “寻求真理”作为AI发展原则, 还有对现实世界当作最终测试场的认知, 给这场席卷全球的智能爆炸, 予以了不可或缺的思考维度。

标签: Grok4 xAI 马斯克 AI订阅计划 Humanity’sLastExam

发布评论 0条评论)

还木有评论哦,快来抢沙发吧~