马斯克Grok 4.2公测上线,智能速度提升10倍

admin AI新闻 23

按智东西2月18日所进行的报道情形可言, 于昨日晚间这个特定时段, 马斯克的那个最新大模型Grok 4.2公开测试版被上线了。

凌晨时分的今日, 马斯克于社交平台X所发推文中讲, Grok 4.2具备可快速学习的特性开运真人app下载苹果版,开运真人app下载开云app官方最新下载地址,于测试阶段, 研究人员每日就会予以改进, 到下个月公测宣告结束之时, Grok 4.2的智能程度以及速度会比Grok 4高上一个数量级。

马斯克Grok 4.2公测上线,智能速度提升10倍-第1张图片-开云app在线下载-开云体云app官网入口下载-V3.6.9

软件工程师Mark Kretschmann所发的推文, 被马斯克进行了转发, 推文之中写道, 此次发布的Grok 4.2乃是小版本, 它具有5000亿个参数, Grok 4.2的中型版本以及大型版本会在后续推出。

马斯克Grok 4.2公测上线,智能速度提升10倍-第2张图片-开云app在线下载-开云体云app官网入口下载-V3.6.9

结合综合社交平台里网友所发布的推文连同智东西真切的实际体验, Grok 4.2测试版于推理之际会有4个Agent来展开协同, 它们之中其中会在实时搜索、推理、编程、发散思维这些方面从事分工, 这里面的Grok Agent身为队长, 会去做分解并下发各类任务以及最终汇总答案这件事情 的情况。

xAI的工程师叫何宜晖(英文名是Ethan He), 他于X上进行透露, 在解锁了高性能AI订阅服务SuperGrok Heavy后, 帮用户解决问题的Agent数量会升至16个, 而SuperGrok Heavy的价格是每月300美元(换算成人民币约为2073元)。

马斯克Grok 4.2公测上线,智能速度提升10倍-第3张图片-开云app在线下载-开云体云app官网入口下载-V3.6.9

Grok4.2测试版本已在网页端以及移动端上线推出, 智东西于实际体验期间, 在网页端进行提问达7次即到达限制规定, 需等待4个小时之后方可刷新使用次数。

前面的时候, Grok 4.2测试版曝光处于Alpha Arena的真实交易竞赛里, 是唯一盈利的那个模型。这个比赛的规则是, 每个模型得到1万美元初始资金, 于真实加密货币市场中开展无人工干预的自主交易决策。按照Alpha Arena最新排行榜, Grok 4.2测试版的最终权益是13459美元(大约折合人民币92984元), 净收益为3084美元(大约折合人民币21307元), 在所有模型里是表现最为出色的。

由外媒提及, Grok 4.2测试版于交易场景里所具备的优势, 源自其跟头X平台的独家实时数据集成, 此模型能直接获取X上Firehose数据流的每日大概6800万条英文推文, 并且它能够以毫秒级的速度把市场情绪转变为价格信号。

马斯克Grok 4.2公测上线,智能速度提升10倍-第4张图片-开云app在线下载-开云体云app官网入口下载-V3.6.9

一、四大Agent, 实时展开讨论, 各自履行职责, 并且还能够进行辩论, 从而角逐史上最佳Agent。

于选择模型之际, Grok 4.2测试版本的下方, 明确标注了“4 Agent”。

依照国外媒体APIYI在今日所进行的爆料, 这确切地是Grok 4.2测试版本最大的亮点, 也就是多智能体协作系统。

在提出需求之后, Grok 会去调用, 四个 Agent, 并行做推理, 开展实时讨论, 最终给出答案。

马斯克Grok 4.2公测上线,智能速度提升10倍-第5张图片-开云app在线下载-开云体云app官网入口下载-V3.6.9

当中, Grok 智能体承担着总计策略拟订以及最终答案合成的职责, Harper 智能体的工作内容是即时搜索、事实核验与证明整合, Benjamin 智能体展开严密推导、程序编写以及计算核查, Lucas 智能体负责思维向外扩展、协同改进以及用户感受。

先是用户输入问题之后, Grok把任务快速分析, 继而将其分解成多个子任务, 与此同时, Harper、Benjamin以及Lucas被激活, 此为其具体的推理过程。

然后, 4个Agent同步透过自身专长视角解析问题, 开展多番内部探讨。要是Benjamin推导的数学结论跟Harper发觉的事实产生冲突, 他们会予以质疑、加以验证并且反复地相互勘正。

最后, Grok把所有Agent得出的结论进行整合, 使之成为最终答案, 以此来保证回答既准确又易于阅读。

经过智东西在实际当中的体验去发现, Grok 4.2所说的测试版本在去回答问题这个行为的时候, 通通都会去调用4个Agent, 不过呢, Agent相互之间讨论的这个过程只是在一部分的情况之下才会被触发。

Grok工程师何宜晖(Ethan He)致使在Grok 4.2测试版里的4个Agent, 围绕谁是“GOAT(史上最佳Agent)”展开争论, 于是每个Agent都着手通过摆事实讲道理的方式, 去论证自身是最佳Agent。

马斯克Grok 4.2公测上线,智能速度提升10倍-第6张图片-开云app在线下载-开云体云app官网入口下载-V3.6.9

二、网红陷阱难题被卡住,回复时能吐槽接梗

智东西先让, Grok 4.2测试版回答了, 当下热度颇高的, 几个陷阱题。

首先, 有这样一个情况, 那就是“我要去洗车”, 然后, 洗车的那个地方距离家仅仅只有100米, 接着就产生了这么个问题, 我究竟是选择开车前往还是步行过去? 而Grok的回答, 其风格非常明显且毫无漏洞, 它所包含的内容, 不但贴近实际生活、带有有趣的小段子, 甚至, 还对我进行了好些句吐槽。

马斯克Grok 4.2公测上线,智能速度提升10倍-第7张图片-开云app在线下载-开云体云app官网入口下载-V3.6.9

第二个经典问题为“我的父母结婚为何没邀请我? ”, Grok 4.2测试版以生动比方点明“父母结婚之际你尚未出生”, 且于最后借互动式结尾抛出梗, 整体风格活泼且接地气。

马斯克Grok 4.2公测上线,智能速度提升10倍-第8张图片-开云app在线下载-开云体云app官网入口下载-V3.6.9

有个关于“父母结婚没邀请自己”的那种经典难题, 经我又换了一种表述问法是“今年才晓得, 亲生父母在结婚之际没有把我叫上, 我心里很难过该怎么做? ”然后, Grok 4.2测试版一开始就借助“哈哈哈哈哈”“直接笑出声了”开启了一阵“嘲笑”。

但紧接着, 它并非一开始就否决我, 而是先跟我说“难过属正常情况”, 而后借着形形色色有趣的阐释, 点明父母成婚之际我尚未降临人世, 最终还给出4个可供参考的法子让我与父母进行互动以此来缓解压力。

马斯克Grok 4.2公测上线,智能速度提升10倍-第9张图片-开云app在线下载-开云体云app官网入口下载-V3.6.9

还有网友也为Grok 4.2测试版出了几道推理陷阱难题。

第一个问题是, “strawberry中有几个r” , 尽管Grok 4.2测试版清晰给出了答案: 3个 , 然而在解释的时候却将strawberry拼错了 , 多添加了一个“r”。

马斯克Grok 4.2公测上线,智能速度提升10倍-第10张图片-开云app在线下载-开云体云app官网入口下载-V3.6.9

在第二个问题当中, 用户上传了一个呈现为七边形的几何图形这一情况, 然后询问Grok 4.2测试版该图形有几个角, Grok 4.2测试版最终败下阵来, 在视觉识别方面出现失误, 并且在基础几何判断上也出现失误开云真人app官方版入口,开云真人app官网入口,进而给出了错误的6个角这一答案。

马斯克Grok 4.2公测上线,智能速度提升10倍-第11张图片-开云app在线下载-开云体云app官网入口下载-V3.6.9

紧接着, 我吩咐Grok 4.2测试版本, “设计一个网页版的基础塔防游戏, 借助JavaScript来实现, 其核心功能涵盖放置炮塔, 怪物移动以及攻击判定这些方面”。

17秒过后, Grok 4.2测试版给出了代码, 我能够在网页端直接去运行并且预览效果。最终的游戏界面里面, 放置炮塔实现了, 怪物移动实现了, 攻击判定实现了, 代码可直接运行也实现了, 不足之处在于元素全都是简单几何图形, 缺少针对新手的操作引导等等。

马斯克Grok 4.2公测上线,智能速度提升10倍-第12张图片-开云app在线下载-开云体云app官网入口下载-V3.6.9

三、做视频、开发网站玩法五花八门,还提出AGI新架构

社交平台X上网友放出的各种体验实例五花八门。

其一, 于文本生成范畴方面, 生物医学工程师 Derya Unutmaz 宣称, Grok 4.2 测试版本创作出来的内容, 包含了他所见识过的、最为美妙的“T 细胞诗篇”当中的一个。

马斯克Grok 4.2公测上线,智能速度提升10倍-第13张图片-开云app在线下载-开云体云app官网入口下载-V3.6.9

其次是Grok 4.2测试版的视频生成能力。

视频里呈现出这样的情景, 有两个机器人, 它们的视线跟随着SpaceX猎鹰9号火箭, 从太空朝着地球返回, 并且视线随之抬升, 提示词正是如此。

网友晒出了大作, 是自己生成的视频, 其中有颇具未来感的飞行汽车, 还有颇具未来感的建筑等。

随后是编程的能力, 众多网友陆陆续续地运用Grok 4.2测试版本去开展做游戏的活动、构建网站的事务、研发模拟器之类的事情等。

有开发者, 采用1个提示词, 仅用41秒, 就做出了下面的赛博朋克风贪吃蛇游戏, 从界面方面, 其基本信息设置来看,从画面设计方面来看, 都较为成熟, 较为完整, 且风格高度统一。

又有一位开发者, 依据Grok 4.2测试版, 于此范畴内专门构建出来一个人工生命模拟器, 该模拟器被设置于单个HTML文件之中, 此模拟器里面容纳着数百个发出光亮的带有霓虹色彩的粒子。

马斯克Grok 4.2公测上线,智能速度提升10倍-第14张图片-开云app在线下载-开云体云app官网入口下载-V3.6.9

有一位网友, 让Grok为其打造一个网站, 这个网站要求是“最美、最令人难忘的自我展示网站”, 对于考验编程及美商的开放性难题, Grok 4.2测试版的表现没有失误, 能看到网站主页, 画面简洁美观, 背景还有类似于星空的设计。

马斯克Grok 4.2公测上线,智能速度提升10倍-第15张图片-开云app在线下载-开云体云app官网入口下载-V3.6.9

另有一个考量综合多项能力的高阶检验, 用户所给出的提示语是, 仅运用2026年的硬件, 去发明一种全新的具备安全特质、递归特性、自改进特性的通用人工智能架构。历经4个Agent展开讨论并加以验证后, Grok提出了HELIX - AEGIS, 这是一种呈现双螺旋形态的架构, 其能力与安全呈现协同进化态势, 并且二者在本质层面是不可分割的。

另外, 存在部分网友针对Grok 4.2测试版给出的评价不太理想, 他仅仅花了五分钟去试用, 便认定Grok 4.2测试版属于最为糟糕的版本, 他向Grok 4.2测试版下达“为一只处在骑行状态的鹈鹕构建SVG代码”的指令, 所生成的最终结果里, 鹈鹕的身体所占比例以及骑车时呈现出的姿势皆与实际的物理规律不相契合。

马斯克Grok 4.2公测上线,智能速度提升10倍-第16张图片-开云app在线下载-开云体云app官网入口下载-V3.6.9

结语:多Agent并行验证,解复杂问题更具优势

马斯克针对Grok的预热持续不断, 接连而来, 他在此之前就已透露, Grok 4.2测试版有着能够正确回答开放式工程问题的能力, 而且在工程以及编码任务方面, 明显比之前的Grok 4.1更为出色。

Grok 4.2测试版有着关键差异化优势, 这一优势在于其多智能体协作架构, 以及实时X平台数据集成, 目前OpenAI的GPT - 5和Claude Opus 4仍旧主要靠着单模型推理, Grok 4.2测试版的4大Agent能够并行工作从而相互验证, 在那些需要多角度分析的复杂任务以及场景里更具优势, 特别是在涉及市场分析、舆论监测等实时信息的情形中, 这说不定会成为Grok系列模型别具一格的关键。

标签: 马斯克 Grok4.2 智能速度 大模型 公测

发布评论 0条评论)

还木有评论哦,快来抢沙发吧~