封面提示词:Alarm clock, hands move clockwise --ar 16:9 --raw --sref 798619805 --sv 6

上周精选✦

Anthropic 发布 Mythos 模型和一系列功能

前几天爆料的 Anthropic 超级模型 Mythos 居然真的存在。Anthropic 说,这是他们至今为止最强的模型。

测评结果远高于 Opus 4.6,在代码理解、漏洞挖掘和利用上表现出了明显的跃迁能力,强大到他们不敢公布。然后只用这个 Project Glasswing,有限地提供给那些互联网基础设施的服务商,去帮他们发现漏洞。

他甚至在 Linux 内核中,自主找到了多个连续的漏洞,实现了从一个无权限的普通用户提权,拿到了 root 权限。

还发现了一个 OpenBSD 存在了 27 年的老漏洞,OpenBSD 以「最安全操作系统之一」著称。还有一个是 FFmpeg 存在了 16 年的老漏洞。

他非常擅长把三五个看起来价值不大的小漏洞,组合成一个复杂的多步 exploit 变成大漏洞。

然后这个模型的价格是 $25 / $125(百万输入 / 输出 token)。本身是不会开放给公众使用的。后续他们会把这一部分能力,放到 Opus 其他升级模型的能力里去。

我觉得这些评论其实挺有意思。表面上说是为了安全而不公开模型,但实质上也是在把最强的网络进攻武器集中到少数机构手中。

关于模型更加详细的信息可以看 Anthropic 发的 System Card

An image to describe post

估计是为了缓解算力问题,还推出了advisor tool,Sonnet 和 Haiku 这种小模型执行任务的时候,可以调用 Opus 这种大模型介入指导。有人说估计 Anthropic 也会用这种方式让我们访问 Mythos 模型。

因为这样用户无法直接访问模型,又能提高现有模型的能力水平。既能大幅提高 Sonnet 和 Haiku 模型也能力也可以节省成本,因为在这个过程中 Opsu 消耗量很少。

调用的话只需要把 advisor_20260301 加到 tools 数组里,指定 advisor 模型(通常是 Opus)和最大调用次数就行。

An image to describe post

还发布云端托管 Agent 基础设施 Claude Managed Agents

帮你把安全沙箱、会话状态、权限管理、凭证和追踪等底层工程都打包好,只需要定义任务、工具和规则,就能让 Agent 长时间自主运行、调用工具、恢复错误,还有多 Agent 协同和自我评估迭代,把从原型到生产的周期从几个月压缩到几天。

开发和上线速度提升 3–10 倍,工程团队可以少花时间在基础设施上,多把精力放在产品体验和业务集成上,计费方式是在 Claude 标准 token 单价基础上,每小时会话活跃运行额外收取 0.08 美元。

AMD 高级人工智能总监也在 github 提了一个 Issues 详细量化分析了一下,Claude Code 在复杂工程场景里的质量明显退化

用 6,800 多个会话、十几万次工具调用的日志做了系统分析,发现「思考内容被隐藏」的改动时间线,与模型在长会话、多文件改动里的表现变差高度吻合。具体表现包括:不再先系统阅读代码而是直接修改(Read:Edit 从 6.6 掉到 2.0)、更偏向整文件重写而不是精确小改、反复自我推翻的“思考循环”、频繁提前收工、甩锅和向用户“要许可”,以及对项目约定文档里的规范执行度下降等。

结论是:削减深度推理并没有真正节省算力,反而因为错误更多、反复重试和人工救火,让整体 token 消耗暴涨、工程效率崩塌。

但是 Anthropic 的人也在下面评论进行了解释,反正意思还是他们没有发现问题,也没有动模型,但大家体感上确实都感觉变得非常差。
An image to describe post