封面提示词:blackbird flying, close-up --chaos 35 --ar 16:9 --profile kx1xb4g

大家好我是歸藏,我们一起来回顾一下 25 年八月11 号到 17 号这一周的 AI 新闻和内容。

这次的音频部分非常完整,可以直接听完整个周刊内容
An image to describe post

上周精选✦

谷歌开始为这周的发布会做预热

谷歌这周 20 号晚上会举行发布会发布今年的 Pixel 手机等硬件更新,还有他们的收款折叠屏手机,当然硬件上的 AI 功能也是非常重点的,上周已经开始为了发布会进行预热了,都是端侧 APP 可以用到的 AI 内容。

首先是为了端侧 AI 任务训练的超小 LLM Gemma 3 270M,一共 0.27B 的参数大小,上下文居然有 256K,提示词遵循非常好。

这个模型在端侧设备上的运行成本非常低,在 Pixel 9 Pro SoC 上INT4 量化的模型在 25 次对话中仅消耗了 0.75% 的电量。

而且在 lmarena 还泄露了一个叫 nano-banana 的图像编辑模型,我试了一下很不错,在生成的图像质量和融合度上比 FLUX Kontext 强,提示词遵循也好,好像也是谷歌的,既然叫 Nano 了,可能模型也不大,不会也是可以在端侧怕的吧。

谷歌还发布了 Imagen 4 的 fast 版本,每张图只需要 2 美分,生成速度相较于原有的 Imagen 4 模型快 10 倍,同时最高生成 2K 分辨率的图片,目前每张图片定价:$0.06/Ultra,$0.04/Standard,$0.02/Fast。

Gemini APP 也有更新,带来了记忆功能,现在可以引用你的历史聊天记录以提供更个性化的回复。

Gemini CLI 原生集成到 VS Code 里面了,现在可以感知当前打开的文件和选中的代码,需要通过 CLI 命令 /ide install 安装扩展。
An image to describe post