封面提示词:POV riding atop a giant ladybug, gripping its smooth wings, flying through a forest of oversized flowers, petals brush against the viewer’s face, the ground far below, dizzying speed as the ladybug zooms between trees and plants, a feeling of altitude and rapid movement, sunlight streaming through the canopy, pollen floating in the air, cinematic macro shot, hyper-realistic textures --ar 16:9 --stylize 250
上周精选✦
2025 谷歌 I/O 大会预热
这周几个公司没啥大动作,都在等着狙击谷歌呢,5 月 20 号今年的 I/O 大会就要开了,谷歌这周就开始了预热,发了一系列现有模型的重要升级,但这些都是前菜,从泄露的信息来看从图片(Imagen3)到视频(Veo3)到 LLM 都有大版本的升级,不知道会有多强。
首先是Gemini 2.5 Pro 05-06 版本,早于其计划在 I/O 大会上的正式亮相。新版本在构建网页应用、编辑代码和创建代理工作流等编码任务上带来了重大升级。它现已登顶 WebDev 竞技场排行榜,并在 VideoMME 基准测试中获得了 84.8% 的高分。
我也试了一下代码能力提升非常大,而且基于他们的视频多模态理解能力,可以实现通过视频还原前端动画,可以看这里的测试。
谷歌的 Gemini Flash 图像生成能力也升级了,具有更好的视觉质量,更准确的文本渲染,显著降低的过滤阻断率
Gemini 上线了隐式缓存功能,不需要开发者主动创建缓存,现在如果该请求与之前某个请求存在共同前缀,则可能触发缓存命中,谷歌会自动提供 75% 的 Token 折扣