用 Claude Code 实现小宇宙播客「一键深度学习」

为什么要做这件事

我经常听小宇宙播客，但有个困扰：听完就忘。

一集播客动辄三四十分钟，里面可能有十几个知识点、好几个故事、几句让你拍大腿的金句。但听的时候觉得「好有道理」，第二天就只记得个大概了。

我想要的是：听完一集播客后，手边能有一套完整的学习材料——有原文可以回查，有提炼好的知识点，有思维导图一目了然，还有针对重点内容的深度问答。

手动做这些事太麻烦了。光是把音频转成文字、再整理知识点，就得花比听播客本身更长的时间。

所以我用 Claude Code 搭了一套自动化流程：给它一个小宇宙链接，它自动帮我走完全部流程，输出 4 份学习笔记。

下面完整记录我是怎么做的。

最终效果展示

用我实际跑过的一集播客来展示——「贵人介绍所」的 005｜对谈武志红：一旦拥有主体性，人生会开挂！，时长 31 分钟。

我只需要对 Claude Code 说一句话：

深度学习这个小宇宙播客 https://www.xiaoyuzhoufm.com/episode/68820823a9dec92500f7bd04

然后它会自动完成 6 个阶段的工作，最终生成 4 个文件：

文件	大小	内容
文稿.md	34K	完整的逐字转写文稿，带说话人标注和时间戳
知识点提取.md	7.6K	按「核心原理 → 执行细节 → 常见误区」结构化整理的知识点
005_对谈武志红_一旦拥有主体性人生会开挂_知识点提取.png	1.2MB	自动生成的思维导图，一张图看清全部知识结构
完整问答.md	49K	17 个深度问题 + 完整答案，覆盖播客所有核心要点
AI提炼的思维导图：

甚至我们还可以让AI在NotebookLM自动生成一份哆啦A梦风格的PPT：
https://i.brmys.cn/file/1770808092999_主体性让人生开挂.pdf

一集 31 分钟的播客，产出了将近 100K 的学习材料。

这套流程用到了什么

在讲具体流程之前，先简单介绍几个关键工具。

Claude Code

Claude Code 是 Anthropic 出的一个命令行 AI 助手。你可以把它理解成一个住在你终端里的超级助手——它能读写文件、执行命令、操作浏览器，而且你可以用自然语言跟它对话。

Skill（技能）

Skill 是 Claude Code 的一个概念，类似于给 AI 写的操作手册。你把一套复杂流程的每个步骤都写清楚，存成一个文件，以后只要触发这个 Skill，Claude Code 就会按照手册一步步执行。

比如这次的「小宇宙深度学习」就是一个 Skill。我把 6 个阶段、20 个步骤全部写在一份文档里。下次再学一集新播客，我只要说一句话，它就知道该怎么做。

用到的外部工具

工具	用途	链接
通义听悟	阿里的音频转文字服务，准确率很高	tingwu.aliyun.com
NotebookLM	Google 的 AI 笔记本，上传文稿后可以对内容提问	notebooklm.google.com
AmyMind	AI 思维导图工具，粘贴文本自动生成思维导图	app.amymind.com
Playwright	浏览器自动化工具，Claude Code 用它来操作网页	-

完整流程：6 个阶段

下面是整个流程的详细拆解。

第一阶段：从小宇宙下载音频

问题： 小宇宙没有提供直接的下载按钮，常用的下载工具（比如 yt-dlp）也不支持小宇宙。

解决方案： 用 Playwright 自动打开小宇宙的播客页面，从网页的 <audio> 标签里提取出音频文件的真实地址，然后用 curl 下载。

具体来说，Claude Code 会：

用浏览器打开小宇宙的播客页面
从页面代码里找到音频地址（格式类似 https://media.xyzcdn.net/xxx.m4a）
同时抓取播客标题、节目名称、时长等信息
把音频文件下载到本地

实测中，那集武志红的播客音频大小是 57MB。

第二阶段：用通义听悟把音频转成文字

音频下载好之后，需要把它转成文字。

Claude Code 会用 Playwright 操作浏览器，自动完成以下步骤：

打开通义听悟
检查是否已有这个音频的转写记录（避免重复转写）
如果没有，点击「上传音视频」，把音频文件传上去
等待转写完成（31 分钟的音频大约需要 2-3 分钟）
导出 .docx 格式的文稿

通义听悟的转写质量很好，能自动识别说话人，还带时间戳。

第三阶段：把文稿转成 Markdown 笔记

通义听悟导出的是 Word 文档（.docx），我需要的是 Markdown 格式（在 Obsidian 里方便查看和关联）。

Claude Code 会：

用 Python 把 .docx 文件的内容提取出来
加上笔记的元信息（标题、来源、播客名、小宇宙链接、通义听悟链接等）
保存为 .md 文件到我的 Obsidian 笔记库里

最终生成的文稿文件长这样：

标题：005｜对谈武志红：一旦拥有主体性，人生会开挂！
来源：小宇宙
播客：贵人介绍所
时长：31:01

---

发言人 00:02
大家好，欢迎来到贵人介绍所......

发言人 01:15
我们今天请到的嘉宾是武志红老师......

第四阶段：用 NotebookLM 提取知识点

这是整个流程最有价值的部分之一。

NotebookLM 是 Google 做的一个 AI 笔记本工具。你把一份文档传进去，它就能基于这份文档回答你的问题——而且只会根据文档内容回答，不会瞎编。

Claude Code 会：

把上一步生成的文稿上传到 NotebookLM，创建一个新的笔记本
读取我事先写好的「知识点提取」提示词
把提示词发给 NotebookLM

我的提示词要求它：

扮演一位知识管理专家
按照「核心原理 → 执行细节 → 常见误区」的结构来整理
不允许省略任何具体的工具、方法论、书籍或案例
最后要自检有没有遗漏

NotebookLM 返回的结果直接保存，一个字都不改。

这一集播客，它帮我整理出了 4 大模块：

第一模块：主体性的起源与内核（真实自体 vs 虚假自体）
第二模块：高手的做事逻辑（感觉做事 vs 思维做事）
第三模块：破解「全能自恋」与完美主义
第四模块：重建主体性的实操路径

每个模块都有核心原理、具体案例、常见误区，结构非常清晰。

第五阶段：自动生成思维导图

知识点提取完之后，Claude Code 会把它变成一张思维导图，方便一眼看清整体结构。

它使用的是 AmyMind——一个 AI 思维导图工具，支持粘贴文本直接生成思维导图。

具体操作：

用浏览器打开 AmyMind
点击「新建」→「粘贴文本」
把知识点提取的内容粘贴到「您的文字」输入框
把思维导图格式要求粘贴到「提示词」输入框
点击「生成」，等待 AI 生成思维导图
生成完毕后，点击「导出」→「Image .png」→「下载原图」
把下载的图片移动到笔记目录

最终得到一张完整的思维导图，四个模块的知识结构一目了然。

这一步有个小坑：AmyMind 导出的文件名不是播客标题，而是固定叫 null.png。所以需要根据文件的下载时间来识别哪个是刚导出的文件，然后重命名。

第六阶段：递归提问，生成完整问答

这是信息密度最高的一步。

Claude Code 会：

让 NotebookLM 针对播客内容生成 15-20 个问题，覆盖受访者背景、主要观点、关键故事、人生经历、金句名言等各个维度
然后逐个问题单独提问，获取每个问题的完整答案
把所有问答整理成一份带目录的完整文档

这一集播客，NotebookLM 生成了 17 个问题，比如：

Q1：缺乏主体性的三种典型状态是什么？
Q4：希望工程中跑调小男孩为什么获得了最热烈的掌声？
Q7：感觉做事 vs 思维做事的核心区别是什么？
Q10：广州女孩追求绝对完美为何走向自我毁灭？

每个问题都有详细的完整答案，最终这份问答文档有 49K——比原始文稿还要长。因为 NotebookLM 在回答时会引用文稿中的具体内容，并进行解释和分析。

所有答案同样原封不动保存，不做任何改动。

总结

这套流程把「听播客」从一次性的消费行为，变成了可沉淀、可检索、可回顾的学习过程。

一集 31 分钟的播客，自动产出：

一份完整文稿，随时可以回查原文
一份结构化的知识点提取，按模块整理好
一张思维导图，一眼看清知识全貌
一份 17 问的深度问答，覆盖所有核心要点

以前听完一集播客，脑子里只剩个模糊的印象。现在我的笔记库里有了一套完整的学习材料，任何时候想复习，翻开就能看。

这才是「深度学习」一集播客该有的样子。

白日梦与诗

探索

用 Claude Code 实现小宇宙播客「一键深度学习」

用 Claude Code 实现小宇宙播客「一键深度学习」

为什么要做这件事

最终效果展示

这套流程用到了什么

Claude Code

Skill（技能）

用到的外部工具

完整流程：6 个阶段

第一阶段：从小宇宙下载音频

第二阶段：用通义听悟把音频转成文字

第三阶段：把文稿转成 Markdown 笔记

第四阶段：用 NotebookLM 提取知识点

第五阶段：自动生成思维导图

第六阶段：递归提问，生成完整问答

总结

关系图谱

目录