给 Hermes Agent 外挂一个“超级大脑”:用自然语言操控 Google Notebook LM
给 Hermes Agent 外挂一个“超级大脑”:用自然语言操控 Google Notebook LM
这期视频讲的是如何将 Google 的 Notebook LM 集成到 Hermes Agent 中,从而构建一个更强大、更省 Token 的知识库。如果你已经在用 Hermes Agent,但觉得内置的 RAG 方式太耗 Token、同步不便,或者想直接让 AI 帮你生成幻灯片、讲解视频,这篇教程就是为你准备的。
视频作者演示了集成后的几个核心能力:用自然语言列出 / 操作所有笔记、自动将论文添加到指定笔记本、基于笔记内容生成幻灯片,甚至生成了一个完整的 AI 讲解视频。整个操作无需手动切换网页,全在 Hermes Agent 的命令行里完成。
核心步骤:三分钟搞定集成
作者强调,集成本身“非常简单”,核心依赖一个开源项目 notebook-lm-py。但原项目没有原生适配 Hermes Agent,且存在 Cookie 过期问题,因此作者 Fork 了一份并做了针对性优化(修复了 Cookie 15 分钟过期的 Bug)。
安装过程可以完全交给 Hermes Agent 自己完成:
- 让 Hermes Agent 自动安装:在 Hermes Agent 中输入类似“阅读这个项目的安装说明并安装这个项目”的提示词,后面跟上作者 Fork 的仓库链接。Hermes Agent 会自动执行安装脚本。
- 备选方案(Codex):如果担心自动安装出错,也可以用 Codex 工具执行同样的安装指令。
- 登录 Notebook LM:安装完成后,在终端执行一条命令(作者在视频中展示了命令行,但未展示具体命令字符串,称“按照提示来登录”即可)。如果登录失败,还可以通过 Cookie 方式登录。作者演示了如何让 Hermes Agent 自己讲解 Cookie 登录的步骤,非常方便。
注意:视频中未给出具体的安装命令和仓库链接。实际操作时,请以作者 Fork 项目的 README 文档为准。核心流程是:安装
notebook-lm-py→ 登录认证 → 在 Hermes Agent 中调用。
实战演示:从论文查询到视频生成
集成完成后,作者进行了多轮演示,展示了其强大的能力。整个过程只需用自然语言描述任务,Hermes Agent 会自动调用 Notebook LM 的 Skill 并执行。
1. 知识库查询与对比
- 列出笔记:输入“列出我的 Notebook LM 中所有的笔记”,系统立即返回了所有笔记列表,并与网页端内容一致。
- 跨笔记查询:输入“从 Notebook LM 的 Cloud Code 笔记本中查找如何开启 Cloud Code 的 Play Mode”,系统自动将中文查询词翻译成更精确的英文,调用 Notebook LM 进行搜索,并返回了包含快捷键、命令行、配置文件修改等 4 种开启方式的完整中文结果。作者特别指出,整个过程“查询速度非常快”。
2. 自动化内容创作
- 添加论文:输入“将这篇论文添加到 AI 智能体记忆的笔记里”并附上论文链接,Hermes Agent 自动将论文 PDF 添加到了指定的 Notebook 中。刷新网页端,内容已同步。
- 生成幻灯片:输入“将刚才我们查看的 AI Agent 记忆的笔记直接生成幻灯片,并且保存到我本地的桌面上”,系统自动调用 Notebook LM 的生成功能,并将生成的 PPT 文件保存到了本地。
- 生成讲解视频:这是最惊艳的部分。作者输入“生成讲解视频,并且放在桌面上”,等待约 20 分钟后,一个带有 AI 语音讲解的视频文件就生成了。视频内容质量不错,并且可以在 Notebook LM 网页端同步查看。
3. 深度研究:论文分析三步走
作者以“大模型微调”为例,演示了完整的研究流程:
- 创建笔记本并搜集资料:输入“搜索 3 篇与大模型微调相关的论文,创建新的 Notebook 放入论文”。系统自动搜索、创建 Notebook 并添加了 3 篇 PDF。
- 深度研究:输入“通过 Notebook LM 研究一下并讲解 LoRA 微调”。系统自动生成了比用户提示更详细的查询词,要求 Notebook LM 讲解核心内容、方法原理、实验结果等,并输出了结构化的研究结果。
- 生成思维导图与测验:分别输入“用 Notebook LM 生成 Mind Map”和“通过 Notebook LM 生成 Quiz”。系统依次生成了大模型微调技术的思维导图(可展开查看节点)和一套包含 10 道题的测验,并将文件保存在本地。
作者的判断与架构解析
作者认为,这套方案的核心价值在于:
- 省 Token:相比直接在 Hermes Agent 中构建 RAG,Notebook LM 作为外部知识库,查询成本更低。
- 多端同步:Notebook LM 是云服务,笔记内容天然支持多设备同步。
- 功能强大:Notebook LM 自带的生成音频、视频、PPT、思维导图等功能,直接为 Hermes Agent 赋予了多模态内容创作能力。
- 形成知识飞轮:可以持续向 Notebook 中添加新内容,长期积累形成个人知识库。
视频中作者还画了一张架构图来说明流程:用户输入 → Hermes Agent 核心层(解析意图、调度 Skill) → notebook-lm-py 的 Skill → 本地认证层(Cookie 刷新) → 与 Google Notebook LM 云端交互 → 返回结果。
国内访问与国产替代
- 国内访问:Notebook LM 是谷歌服务,需要稳定的网络环境才能正常访问和使用。这是该方案在国内使用的主要门槛。
- 国产替代:如果需要类似的知识库功能,可以关注国内大模型平台的知识库(RAG)应用或智能体(Agent)平台,例如百度千帆、阿里百炼、字节豆包等,它们都提供了类似的知识库构建和内容生成能力。
内容来源
- YouTube手动粘贴字幕 · 手动字幕视频 S6XCelOhZ6w(需科学上网)
文中引用的商标、产品名称及相关内容,版权归原权利人所有。本教程为 AIBoxPro 基于公开信息整理的原创解读,非视频字幕翻译或搬运。
如涉及版权问题,请联系 4514407@qq.com,48 小时内核实处理。