用 Claude Code 实现小宇宙播客「一键深度学习」
为什么要做这件事
我经常听小宇宙播客,但有个困扰:听完就忘。
一集播客动辄三四十分钟,里面可能有十几个知识点、好几个故事、几句让你拍大腿的金句。但听的时候觉得「好有道理」,第二天就只记得个大概了。
我想要的是:听完一集播客后,手边能有一套完整的学习材料——有原文可以回查,有提炼好的知识点,有思维导图一目了然,还有针对重点内容的深度问答。
手动做这些事太麻烦了。光是把音频转成文字、再整理知识点,就得花比听播客本身更长的时间。
所以我用 Claude Code 搭了一套自动化流程:给它一个小宇宙链接,它自动帮我走完全部流程,输出 4 份学习笔记。
下面完整记录我是怎么做的。
最终效果展示
用我实际跑过的一集播客来展示——「贵人介绍所」的 005|对谈武志红:一旦拥有主体性,人生会开挂!,时长 31 分钟。
我只需要对 Claude Code 说一句话:
深度学习这个小宇宙播客 https://www.xiaoyuzhoufm.com/episode/68820823a9dec92500f7bd04
然后它会自动完成 6 个阶段的工作,最终生成 4 个文件:
| 文件 | 大小 | 内容 |
|---|---|---|
| 文稿.md | 34K | 完整的逐字转写文稿,带说话人标注和时间戳 |
| 知识点提取.md | 7.6K | 按「核心原理 → 执行细节 → 常见误区」结构化整理的知识点 |
| 005_对谈武志红_一旦拥有主体性人生会开挂_知识点提取.png | 1.2MB | 自动生成的思维导图,一张图看清全部知识结构 |
| 完整问答.md | 49K | 17 个深度问题 + 完整答案,覆盖播客所有核心要点 |
| AI提炼的思维导图: | ||
![]() |
甚至我们还可以让AI在NotebookLM自动生成一份哆啦A梦风格的PPT:
https://i.brmys.cn/file/1770808092999_主体性让人生开挂.pdf
一集 31 分钟的播客,产出了将近 100K 的学习材料。
这套流程用到了什么
在讲具体流程之前,先简单介绍几个关键工具。
Claude Code
Claude Code 是 Anthropic 出的一个命令行 AI 助手。你可以把它理解成一个住在你终端里的超级助手——它能读写文件、执行命令、操作浏览器,而且你可以用自然语言跟它对话。
Skill(技能)
Skill 是 Claude Code 的一个概念,类似于给 AI 写的操作手册。你把一套复杂流程的每个步骤都写清楚,存成一个文件,以后只要触发这个 Skill,Claude Code 就会按照手册一步步执行。
比如这次的「小宇宙深度学习」就是一个 Skill。我把 6 个阶段、20 个步骤全部写在一份文档里。下次再学一集新播客,我只要说一句话,它就知道该怎么做。
用到的外部工具
| 工具 | 用途 | 链接 |
|---|---|---|
| 通义听悟 | 阿里的音频转文字服务,准确率很高 | tingwu.aliyun.com |
| NotebookLM | Google 的 AI 笔记本,上传文稿后可以对内容提问 | notebooklm.google.com |
| AmyMind | AI 思维导图工具,粘贴文本自动生成思维导图 | app.amymind.com |
| Playwright | 浏览器自动化工具,Claude Code 用它来操作网页 | - |
完整流程:6 个阶段
下面是整个流程的详细拆解。
第一阶段:从小宇宙下载音频
问题: 小宇宙没有提供直接的下载按钮,常用的下载工具(比如 yt-dlp)也不支持小宇宙。
解决方案: 用 Playwright 自动打开小宇宙的播客页面,从网页的 <audio> 标签里提取出音频文件的真实地址,然后用 curl 下载。
具体来说,Claude Code 会:
- 用浏览器打开小宇宙的播客页面
- 从页面代码里找到音频地址(格式类似
https://media.xyzcdn.net/xxx.m4a) - 同时抓取播客标题、节目名称、时长等信息
- 把音频文件下载到本地
实测中,那集武志红的播客音频大小是 57MB。
第二阶段:用通义听悟把音频转成文字
音频下载好之后,需要把它转成文字。
Claude Code 会用 Playwright 操作浏览器,自动完成以下步骤:
- 打开通义听悟
- 检查是否已有这个音频的转写记录(避免重复转写)
- 如果没有,点击「上传音视频」,把音频文件传上去
- 等待转写完成(31 分钟的音频大约需要 2-3 分钟)
- 导出
.docx格式的文稿
通义听悟的转写质量很好,能自动识别说话人,还带时间戳。
第三阶段:把文稿转成 Markdown 笔记
通义听悟导出的是 Word 文档(.docx),我需要的是 Markdown 格式(在 Obsidian 里方便查看和关联)。
Claude Code 会:
- 用 Python 把
.docx文件的内容提取出来 - 加上笔记的元信息(标题、来源、播客名、小宇宙链接、通义听悟链接等)
- 保存为
.md文件到我的 Obsidian 笔记库里
最终生成的文稿文件长这样:
标题:005|对谈武志红:一旦拥有主体性,人生会开挂!
来源:小宇宙
播客:贵人介绍所
时长:31:01
---
发言人 00:02
大家好,欢迎来到贵人介绍所......
发言人 01:15
我们今天请到的嘉宾是武志红老师......
第四阶段:用 NotebookLM 提取知识点
这是整个流程最有价值的部分之一。
NotebookLM 是 Google 做的一个 AI 笔记本工具。你把一份文档传进去,它就能基于这份文档回答你的问题——而且只会根据文档内容回答,不会瞎编。
Claude Code 会:
- 把上一步生成的文稿上传到 NotebookLM,创建一个新的笔记本
- 读取我事先写好的「知识点提取」提示词
- 把提示词发给 NotebookLM
我的提示词要求它:
- 扮演一位知识管理专家
- 按照「核心原理 → 执行细节 → 常见误区」的结构来整理
- 不允许省略任何具体的工具、方法论、书籍或案例
- 最后要自检有没有遗漏
NotebookLM 返回的结果直接保存,一个字都不改。
这一集播客,它帮我整理出了 4 大模块:
- 第一模块:主体性的起源与内核(真实自体 vs 虚假自体)
- 第二模块:高手的做事逻辑(感觉做事 vs 思维做事)
- 第三模块:破解「全能自恋」与完美主义
- 第四模块:重建主体性的实操路径
每个模块都有核心原理、具体案例、常见误区,结构非常清晰。
第五阶段:自动生成思维导图
知识点提取完之后,Claude Code 会把它变成一张思维导图,方便一眼看清整体结构。
它使用的是 AmyMind——一个 AI 思维导图工具,支持粘贴文本直接生成思维导图。
具体操作:
- 用浏览器打开 AmyMind
- 点击「新建」→「粘贴文本」
- 把知识点提取的内容粘贴到「您的文字」输入框
- 把思维导图格式要求粘贴到「提示词」输入框
- 点击「生成」,等待 AI 生成思维导图
- 生成完毕后,点击「导出」→「Image .png」→「下载原图」
- 把下载的图片移动到笔记目录
最终得到一张完整的思维导图,四个模块的知识结构一目了然。
这一步有个小坑:AmyMind 导出的文件名不是播客标题,而是固定叫
null.png。所以需要根据文件的下载时间来识别哪个是刚导出的文件,然后重命名。
第六阶段:递归提问,生成完整问答
这是信息密度最高的一步。
Claude Code 会:
- 让 NotebookLM 针对播客内容生成 15-20 个问题,覆盖受访者背景、主要观点、关键故事、人生经历、金句名言等各个维度
- 然后逐个问题单独提问,获取每个问题的完整答案
- 把所有问答整理成一份带目录的完整文档
这一集播客,NotebookLM 生成了 17 个问题,比如:
- Q1:缺乏主体性的三种典型状态是什么?
- Q4:希望工程中跑调小男孩为什么获得了最热烈的掌声?
- Q7:感觉做事 vs 思维做事的核心区别是什么?
- Q10:广州女孩追求绝对完美为何走向自我毁灭?
每个问题都有详细的完整答案,最终这份问答文档有 49K——比原始文稿还要长。因为 NotebookLM 在回答时会引用文稿中的具体内容,并进行解释和分析。
所有答案同样原封不动保存,不做任何改动。
总结
这套流程把「听播客」从一次性的消费行为,变成了可沉淀、可检索、可回顾的学习过程。
一集 31 分钟的播客,自动产出:
- 一份完整文稿,随时可以回查原文
- 一份结构化的知识点提取,按模块整理好
- 一张思维导图,一眼看清知识全貌
- 一份 17 问的深度问答,覆盖所有核心要点
以前听完一集播客,脑子里只剩个模糊的印象。现在我的笔记库里有了一套完整的学习材料,任何时候想复习,翻开就能看。
这才是「深度学习」一集播客该有的样子。
