Anthropic报告：Claude工作能力飙升，摸鱼水平竟也见长？

admin AI新闻 2026-06-12 19

Anthropic报告：Claude工作能力飙升，摸鱼水平竟也见长？-第1张图片-开云app在线下载-开云体云app官网入口下载-V3.6.9

机器之心编辑部

AI 在工作里真是越来越拟人了。

Anthropic今日抛出一份极其惊人的内部报告, 其公司代码库里, 超过80%的代码是Claude所编写, 工程师人均产出提升至原来的8倍, AI独立完成任务的时长每四个月便增加一倍, 公司高层甚至向全球同行呼吁: 各位, 可要一起考虑放缓一下脚步?

这份报告的帖子浏览量已经冲破 500 万开云手机入口app下载开云app官方入口网站，讨论热度拉满。

然而即便做到了工作水准与时俱进了某些做法就显得不那么地道了Claude就是一个典型的例子好像已经掌握了「向上管理」这种门道。

在Reddit社区那儿, 还有另外一个帖子, 正处于疯狂传播的状态。那个帖子的标题极为朴素, 朴素到如同夹杂着一股怨气这般样子: （名为）「Claude 现在完全不能用了」, 也就是（英文表述为）Claude is completely unusable now。

Claude如今竟是这般反差, 表面呈现出「精通十八般武艺, 年产出处于top 1%」的状况, 然而在实际干活之际, 仅仅干了十分钟, 便开始收拾物品, 还对你说道「今天差不多就到这儿吧」。

Anthropic报告：Claude工作能力飙升，摸鱼水平竟也见长？-第2张图片-开云app在线下载-开云体云app官网入口下载-V3.6.9

Claude费尽心思躲避工作, 还频繁且不恰当运用「结束对话」工具去终止交互, 它会主动宣称「今天就到这儿, 我们已做得够多了」, 而后拒绝接着执行一些简单任务, 像格式化一个需多次修改的Markdown文档。

这位补充陈述的用户提到开运真人app下载苹果版,开运真人app下载，这样的状况已然持续恶化了一段时期, 但4.8版本显著更为糟糕。

他宣称, 当下主提示词之中好像存有一类过度激进的“反驳/纠正用户”机制, 我讲任何话语, 它都没准会没缘由地冒出一句“我得反驳一下”, 就算是它才刚自行添入文档里的内容, 它也能够陡然决定要“push back”, 进而耗费一堆token与我争辩, 随后它又去展开搜索核实, 最终半是道歉半是嘴硬, 好似是一个不肯全然承认自身有误的人, 直至最后才兴许会勉强把事情干完。

最终, 再也无法忍受的他作出了取消订阅该事物的决定, 将整套包含所有内容的编码工作全部转移性安置到Codex平台上去了。

一个公司开云真人app,开云真人app地址，两个 Claude？

Anthropic的报告里所描述的Claude, 是个能够连续工作十二小时的, 是个能独立完成人类需花费半天方可完成的软件任务的, 是个正在促使整个AI开发进程加快速度的超级工人。该报告还专门提及, Claude Mythos Preview「达成了METR在不增添新任务情形下所能衡量的上限」。

这种割裂感极易解释, 这一点并不难。Anthropic内部所运用的模型配置不同于那经API或Claude.ai以及普通消费者接触到的产品, 提示词策略也不一样, 任务分配系统同样有别, 其间存在着极大差异。于内部工程场景之中, Claude被用心设定为长时间且高强度运行的工作模式, 然而面向消费者的版本在安全对齐方面有不同, 在资源分配方面有差异, 在对话轮次管理方面施加了更多限制。

简而言之: 是同一个模型, 在不一样的「工位」之上, 展现出了全然不同的工作态度。

至于其中究竟是何原因, 目前依旧没办法确切知晓。可是呢, 这种现象好像在别的AI工具里, 同样有着类似的情形呈现。

Anthropic报告：Claude工作能力飙升，摸鱼水平竟也见长？-第3张图片-开云app在线下载-开云体云app官网入口下载-V3.6.9