介绍

Google于2025年5月20日的I/O大会上发布了NotebookLM移动版应用(NotebookLM App)。最初它是以网页版提供 AI 笔记和研究助理功能,用户可以把资料导入笔记本,之后可以由 AI 生成摘要、回答问题等。

An image to describe post

经过了一段时间的迭代,目前的功能都很完善,左侧是添加的资料,中间主页面是对话(由 gemini 2.5 flash 驱动),右侧是笔记或者像他名字写的工作室。

我们可以往里面添加多种文件类型,对于 pdf 以及音频,他最后会自动处理(提取文字或语音转文字)成纯文本格式。普通用户似乎一个笔记本是 50 个文档,付费用户能达到 300 个。下方能看到除了直接拖入文档,还可以由谷歌云盘直接导入、通过链接导入网站以及 youtube 视频,以及最朴素的粘贴文字。

An image to describe post

在添加来源的右上角,有一个最新出的功能:探索来源。很多时候我们想探索某一个主题,但是我们甚至连资料都没有,你就可以在这里把你想了解的主题写下来,他会帮你去探索资料。

An image to describe post

还有些情况是你把你有限的资料转进去之后,可能你的资料不是很齐全,对于你想了解的主题不是很全面,你可以点击“我很好奇”,他会根据现有的资料来帮你探索相关资料(不过中文的效果一般)。

An image to describe post

在我们第一次导入资料的时候,它会自动生成摘要,你也可以在工作室部分让他根据你的资料一键生成FAQ、Briefing Doc、Study Guide 等,这在学习的时候是非常有用的,利用做题来帮你更好的了解、利用摘要文档帮你了解大概内容,然后还有学习指导帮你规划好学习路径。

按照不同的特性,这几种的用法我认为先后顺序是这样的:

  1. 简报文档:先帮你了解整个主题的概况,让你有一个初步的认识,形成一个初始的认知框架
  2. 学习指南:心中有了大概的内容之后,你需要一步步的地学习
  3. 常见问题解答:你可以根据学习过程中相应的知识点去进行答题,来了解自己的掌握情况

中间页面(即问答对话部分)就像有一个 7/24 随时在线的老师,解答你的问题,AI 模型会根据你现存的资料来回答你的问题,并且所有回答都附带可点击引用片段,支持跨文档推理,这样既能保证答案的准确性还能帮助学习者回溯相应的知识点。

在工作室的右上角有一个“音频概览”,这个功能我想大概是目前很多 AI 播客的鼻祖,自从 notebooklm 上线之后,就涌现了很多 AI 播客软件。点击生成音频之后,两位 AI 主持基于资料展开 5–15 分钟对话式讲解;支持离线下载和后台播放;目前支持 50+ 种输出语言。这样你在通勤或者一些碎片时间,就能够用听书的方式去了解某一个主题。

整体来说,notebooklm 从输入到输出把对于某一个主题的全链路都设计到了,并且底层由 google 家的强大模型支持,简直是一个学习利器。虽然它支持多语言输出,但是我实测下来还是英文效果比较好,而且它 RAG 的机制对于多语言的效果有时候不是很稳定。

移动版

当 96 %的网民把‘信息入口’放进口袋时,一款只在桌面上出现的知识助手,就像好书被锁在书柜里——看得到,摸不着。

96.3 % 的全球网民用手机上网,并且63 % 的全球网页流量来自移动设备,毫无疑问桌面不再是主战场,手机已成第一信息终端,你的读者、学生、同时——十个人里九个拿手机学东西。

现代人多是碎片场景,排队、通勤、等人,这都是电脑掏不出来手机在手的场景。更何况,随着快节奏时代的到来,人们不愿意再用长时间整块啃长文。

人均每天看手机 4 小时以上,随手点开 NotebookLM 才有机会“占用注意力”。

移动端出来之前,我们在网上看到一些好的PDF,如果那天我在外面没有把电脑打开,我可能就要先存在微信传输助手上。

等我再一次打开电脑,我才会登录微信,然后再把它传输到notebooklm上面,甚至有时候我还会忘了。这样就很大程度上增加了一些操作的难度。

有了移动端,我们可以直接把它分享到 app 上面,直接就是缩短了链路,一步到位。

除了确实方便点,并且更能吸引用户使用外,大部分的功能还是在照搬线上版本,甚至对于 studio 部分的功能还不是完整的。未来我觉得它要真正成长为一个学习助手,还需要引入新的体验或者功能。

现代知识管理不应该只关注知识的获取、整理以及学习输出,还需要强调长期记忆的巩固和应用。Notebooklm 为构建全新的数字学习体系提供了可能,按我的想法来看,或许它还可以考虑“Spaced-Prompt Scheduler”(间隔提示调度)和“Cross-Notebook Collaboration”(跨笔记本协作)这两个功能。

Spaced-Prompt Scheduler(自动间隔复习调度)

传统的间隔重复系统(比如 Anki)通过算法安排学校卡片在逐渐拉长的时间间隔中复习,以最大化记忆保留率。或许,notebooklm 也可以引入这一功能,从用户资料中自动生成测验问题或闪卡。利用这个功能在用户学习某个知识点之后,自动为他生成一组复习提问卡片,并根据用户的回答情况智能安排下一次提示时间。

例如,用户当天阅读了一份报告,NotebookLM生成10道要点问答;用户在回答时,如果某些问题不太确定,系统会第二天再次提示类似问题(强化记忆),答对的则延后几天再测。

这样一来,用户无需手工建立任何卡片库,NotebookLM充当了智能复习助手,动态调整复习计划。由于NotebookLM能理解语义并生成多样化的问题,它甚至可以在后续复习时换种表述考察,促使用户真正掌握概念而非死记答案。

这种 AI 驱动的间隔复习,将人的遗忘曲线与机器的精准提醒结合,或许可以提高长期只是留存。

人的遗忘速度是非常之快的,如果不加以复习,新的知识就会以指数速度流失,这个现象 19 世纪艾宾浩斯就得出来了,也就是非常著名的遗忘曲线。

An image to describe post

典型的遗忘曲线(红线)与间隔复习后遗忘曲线的对比(蓝线)。红线表示在不复习情况下记忆保留率随时间快速下降;蓝线表示通过多次间隔复习将记忆重置并逐渐延长保持时间,显著提高了长期留存率。

所谓“遗忘税”(Forgetting Tax)是一个形象的比喻:指我们因遗忘而付出的“代价”。当知识没有及时巩固,我们日后不得不花更多时间精力重新学习,这就像欠下的税款终将缴清。理解遗忘税,可以帮助我们权衡及时复习与事后重学的成本,并设计合理的学习策略。

“遗忘税”可以理解为红线下方的大面积遗忘(灰色箭头所示),需要通过重新学习来“支付”。而蓝线通过及时“付小费”(少量复习)避免了累积成巨额的遗忘税。

从艾宾浩斯以来的大量研究和实践(如SuperMemo算法、Anki软件)都证明了间隔重复对抗遗忘的有效性。

教育心理学家早在1932年就指出:“复习行为应该以逐渐增加的时间间隔进行……约间隔1天、2天、4天、8天,如此递进”。这正是后来各种间隔算法的雏形。

其背后的道理是:让每次复习恰好发生在遗忘即将发生之际。

太早复习浪费时间,太晚复习则记忆已消退。而科学安排的复习计划能最大化记忆保存率,最小化重复学习时间。

遗忘本身并不可怕,可怕的是忽视遗忘的成本。如果选择不复习而任由遗忘发生,我们终会以更多的精力来补课。这笔“税”可能以考前临阵磨枪的通宵达旦形式、或工作中反复查资料的低效形式体现。相反,及时缴纳“小额税款”——也就是遵循遗忘曲线进行间隔复习——则可以防止“利滚利”式的知识流失。

比如医学专业学生可将课程讲义交给NotebookLM,由其生成每日一组问答题,并按照艾宾浩斯间隔(1天、3天、7天、14天…)自动推送练习。这种“短时勤练”的模式让学生以最小的时间成本持续强化记忆,而不用担心遗忘后再花大代价重学。

Cross-Notebook Collaboration(跨笔记本协作)

另一个值得期待的方向是跨笔记本协作。现实中的知识往往并不局限于单一主题,学科之间的交叉、项目之间的联动早已成为常态。

NotebookLM 若能让不同笔记本互联互通、多人共构、跨域检索——就像把分散的小岛用桥梁和海底光缆连成群岛,知识与灵感会在更大尺度上流动、碰撞、增值。

把「知识孤岛」变成「知识群岛」

如果要跨笔记本协作,首先要解决的是“同一个材料被反复复制”,让更新一次到处生效。这样就不用满世界复制粘贴,可以减少版本冲突。写报告时,引用数据随源头一起更新,不会出现“正文和数据表和”

目前的聊天还只是针对某一个笔记本,如果要跨笔记本协作,还需要有一个通用工作台,在这个工作台里进行聊天可以选取一个或多个笔记本的数据进行资料补充。

或许可以页面可以长这样:

An image to describe post

左侧就是不同的笔记本相关于不同的文件夹。右侧的工作台呢,我们可以选择不同的笔记本,也可以选择所有笔记本去进行交流。这样子就形成了一个创作的空间,也很一目了然。

下一块其实是关于共生,也就是知识它自己会生长。最近我们比较流行的是叫双链笔记,比如说Obsidian,可以把你的不同笔记连接起来,这就形成了知识之间的一个互联。

工具不只是容器,而是合作伙伴——主动提示关联、帮你发现盲区,甚至安排复习。

AI可以在后台运行相似度匹配,就是在我们写下某一段落或某一句话,或者在对话中提到某个东西的时候,AI都可以在后台根据我们写下的或提问的内容去进行相似度的匹配。

这样可以减少我们的重复劳动,比如有的研究我们三个月之前就已经有想法记录了。

当然这个过程其实是需要一个渐进性的。因为如果你一上来就让AI去直接帮你做判断它是不是有关联的,可能会产生一些偏差。因为有的时候AI将语句向量化嵌入之后去进行计算,发现这个是相关的,但实际上我们工作者、创作者并不认为它是相关的。

所以,我们一开始可以让AI先给出一些可能相关的列表,由人去决定要不要连线。当AI学习到人的一些偏好之后,我们就可以慢慢地把这个工作移交给AI。

Youmind:一间“AI 创作工作室”,不只是笔记

写到这我忽然想到了 YouMind,去年我就开始使用的一款 AI 软件。YouMind 自称 AI Creation Studio:它把信息采集、AI 研究、卡片整理、写作生成到对外分享整合到同一“Board”(项目板)里,目标是让创作者从灵感到成稿一次完成。

他这里的 board 就有点像是一个 Notebook,不过 board 里面还有 group,如果我们把 group 看成 Notebook,那 youmind 就像我上面说的可以跨 Notebook 进行 AI chat,因为它也是基于一个 board 进行 chat 的。而我们把 board 看做一个 notebook,那它就不能跨越聊天,但是它已经把输入学习输出一整套流程打通,形成了一个创作 IDE。

An image to describe post

中间是查看文件或者编辑器,右侧是一个 AI 工具箱可以聊天,也可以自定义提示词。官方自带的有Reader(帮你做知识总结)、Chat、Note(可以记笔记)、Translator(翻译)。

An image to describe post

目前来说,Notebooklm 比较侧重于学习这一方面,而 YouMind 比较侧重于整理和输出方面。因为在学习方面,Notebooklm 的底层模型对于知识点的检索做得会比 YouMind 更细腻一点。但是在输出方面,YouMind可以自定义一些 prompt,你可以将任意的材料输出成你想要的内容,它的整个功能就像是为你打造一个创作工作室。

我看官方也在计划做移动端,期待一手👀。

结个尾

上周我在地铁上回家时刷到了一篇几十页的心理学研究。以往我会先把链接传给微信传输助手,放在待办事项,然后回家再抽空上传。但是上周正好赶上 Notebooklm 移动端发布,所以我就直接把文件上传到 Notebooklm 的移动端里面。然后几分钟后就用它的音频概览生成了一篇AI播客。基本上整个流程也就十分钟不到,生成的音频也就十来分钟。

差不多在地铁到站的时候,我就对这个报告的核心有了初步的了解。那个时候我真正体会到,知识管理的未来,真的已经随身携带。

如果说PC时代的笔记工具让我们学会了储存,那么移动端+AI的组合就是在教我们及时理解、随时复用。学习开始脱离成段的坐姿时间,变成了零碎的微循环,从看到、捕捉、提问、到输出。

未来的知识工作者或许更像信息指挥官,而非简单的知识搬运工。我们可以随手调度AI对海量的内容做及时的编排和复习,把深度思考留给人类自己。