封面提示词:the last creation of the firt year --chaos 5 --ar 16:9 --exp 10 --raw --sref 698401885 --profile mhiy882 --sv 4 --stylize 700
在这里收听单人 AI 播客版本:上周AI热点:谷歌、开源与智能体,创新突破与挑战并存 - ListenHub
https://listenhub.ai/episode/u/688f8c50fc9acfe024385e6c
上周精选✦
谷歌上周动作挺多的
首先是谷歌最强大的模型,突然向 Gemini Ultra 用户开放,Gemini 2.5 Deep Think 模型获得了数学奥赛 IMO 的金牌,支持通过“并行思考”和强化学习技术进行头脑风暴,生成多条思路并加以比较,除了数学发现,还能胜任需要创造力和战略规划的任务,LiveCodeBench V6 和 HLE 评分非常之高,这里有海外用户的尝试结果,感觉这种级别的模型不是给我们这种人用的。
谷歌搜索里面的 AI Mode 大幅更新,基本上都快跟 Gemini 功能拉齐了,开始支持上传图片和 PDF 进行提问,增加 Canvas 能力,来展示输出的文档,Search Live ,可以通过视频跟 AI 实时对话。
还给 Android Studio 增加了免费的 Agent 模式,你可以直接跟 Agent 对话开发安卓应用,支持快速选中直接修改 UI 代码,支持自定义规则,这下安卓开发生态完爆苹果了。
NotebookLM 的视频概览终于上线了,但是我看了一下到现在我还么有,除了有音频还有画面内容帮助理解,目前只支持英语,另外现在加了一个精选笔记本,可以直接访问。

FLUX.1-Krea [dev] 开源,主打真实感
Black Forest Labs 和 Krea 一起开源了一个新的图像模型 FLUX.1-Krea [dev],专注于打造具有独特美感的图像。没有“AI 效果”,没有过曝的高光,只有自然的细节。而且这个模型完全可以兼容之前的 FLUX 开源模型生态系统,这个太重要了,我的简单测试在这里。
Krea 也写了一篇技术报告详细介绍了之前的图像模型有 AI 感的原因,同时他们又是如何解决的:
造成 “AI 感” 的根本原因
早期扩散/生成模型在训练与评估上高度依赖客观指标,例如 FID、CLIP Score 以及后期的 DPG、GenEval、T2I-Compbench 等,它们关注的是“能否数出几匹马”“手指是否齐全”这一类结构与属性约束。与此同时,为过滤数据或衡量美学质量而使用的 LAION-Aesthetics、PickScore、ImageReward、HPSv2 等评分器,本质上是对低分辨率图像训练出的模型,这些模型偏好“柔焦背景、过软纹理、明亮曝光”之类的特征。模型为了优化这些指标,逐渐形成了背景过度虚化、皮肤蜡质、构图单调等统一而缺乏灵魂的“AI Look”。
Krea 团队的解决路径
Krea 的核心思路是“让 AI 图像看起来不像 AI 图像”,方法论包括两部分:首先在预训练阶段追求最大化“模态覆盖”,甚至保留“坏样本”,以便模型真正理解什么是缺陷,从而在推理时能通过负向提示避开缺陷;其次在后训练阶段采取强烈主观取向的两步流程——先用少量(<1 M)高度人工甄选、符合内部审美标准的优质图像做监督微调(SFT),再用同样审美导向的人类偏好数据进行多轮 RLHF(TPO)。如此“定向塌缩”使模型在保持多样性的同时,默认输出即偏向高质感、相机真实感与艺术取向,显著弱化了“AI 感”。
