封面提示词:Flowers, background pattern. Minimalism, abstract expression, modern design, high-end feel, hazy aesthetics, soft gradients. The image features a cool color palette (primarily light blue and light green), a hazy springtime texture, motion blur, saturated colors, no text required, thick impasto, iridescent transformation + reflection, dreamy + shimmer, sophisticated atmosphere, transparency, glowing, fine pearlescent shimmer, layered light and shadow, dreamlike lighting, textural reflection, refracted light, diffused light, abstract expression, artistic atmosphere, minimalist art poster.

上周精选✦

智谱正式开源 GLM-5.2

上周智谱正式开源并发布了 GLM 5.2。这应该是继 DeepSeek R1 发布之后,又一个在我的时间线上,让行业头部从业者以及资深研究员对中国模型表现出如此肯定态度的案例。开源模型再一次摸到了前沿模型的门槛,我觉得这件事还是很值得说一下的。

从一些开放的基准测试来看,它都达到了跟 GPT 5.5 和 Opus 4.8 大致能够抗衡的基准测试得分水平。

GLM-5.2 沿用了 DeepSeek V3.2 的 MLA 和 DSA 机制,新增 IndexShare 机制——每四层才运行一次完整的稀疏注意力索引器,后续层复用索引,大幅降低 1M token 推理成本。上下文窗口从 GLM-5.1 的 200K 扩展到 1M。

fast.ai 创始人 Jeremy Howard 称它”至少和 Opus 4.8、GPT 5.5 一样好”,快速、便宜且不啰嗦,但指出最大短板是完全没有视觉能力。

YouTube 知名 AI 博主 Harrison Kinsley(Sentdex)连续三天用它完全替代闭源模型处理所有工作,表示”没有任何任务需要回退”。

Vercel CEO Guillermo Rauch 直言”几乎震惊于它在编程上的表现,这改变了局面”。

开源模型研究者 Nathan Lambert 则称 GLM-5.2 是 Agent 领域的”DeepSeek 时刻”,标志着开源首次触及前沿 Agent 能力。

不过 TypeScript 教育者 Matt Pocock 注意到模型的思考轨迹极长(近 220K token),容易过度思考,认为这是个实际问题。

我也发现了这个问题,就是思考过长,同时思考和输出内容的分配比例不太合理。这会导致在不显示思考内容的产品上,首字的输出速度体感巨慢,实际上它是在思考,体验可能不是很好。

同时,在完成任务的平均工具调用次数上,它的思考程度和思考长度明显比 Opus 4.8 或者 GPT 5.5 要长得多,这样的话总体感觉就是慢。

Altimeter Capital 投资人 Freda Duan 做了一份更冷静的开发者调查:编码表现大致相当于 Codex 5.5 的中等思考水平,前端强于后端,但在复杂推理和泛化上仍有差距。

她特别拆解了定价,表面上 GLM 5.2 比 Opus 便宜 4-6 倍,但考虑缓存命中率和 GLM 约 1.5-2 倍的 token 消耗量后,实际成本差距缩小到 2.7-3.7 倍。

定价争议是这次讨论中最火的话题:GLM-5.2 输出定价 $4.4/M token,DeepSeek V4 Pro 仅 $0.87,而 Sonnet 4.6 是 $15、Opus 4.8 是 $25、GPT 5.5 高达 $30。

AI 分析博主 @scaling01 据此直言”前沿实验室在 API 定价上绝对是在骗你”,利润率可能超过 90%。这番对比客观上构成了对闭源模型定价合理性的直接质疑,当一个 MIT 许可的开源模型在多项评测中逼近甚至匹敌闭源前沿时,几倍乃至十几倍的价差变得越来越难以辩护。
An image to describe post