用 Claude Code 实现小宇宙播客「一键深度学习」

为什么要做这件事

我经常听小宇宙播客,但有个困扰:听完就忘

一集播客动辄三四十分钟,里面可能有十几个知识点、好几个故事、几句让你拍大腿的金句。但听的时候觉得「好有道理」,第二天就只记得个大概了。

我想要的是:听完一集播客后,手边能有一套完整的学习材料——有原文可以回查,有提炼好的知识点,有思维导图一目了然,还有针对重点内容的深度问答。

手动做这些事太麻烦了。光是把音频转成文字、再整理知识点,就得花比听播客本身更长的时间。

所以我用 Claude Code 搭了一套自动化流程:给它一个小宇宙链接,它自动帮我走完全部流程,输出 4 份学习笔记。

下面完整记录我是怎么做的。


最终效果展示

用我实际跑过的一集播客来展示——「贵人介绍所」的 005|对谈武志红:一旦拥有主体性,人生会开挂!,时长 31 分钟。

我只需要对 Claude Code 说一句话:

深度学习这个小宇宙播客 https://www.xiaoyuzhoufm.com/episode/68820823a9dec92500f7bd04

然后它会自动完成 6 个阶段的工作,最终生成 4 个文件:

文件大小内容
文稿.md34K完整的逐字转写文稿,带说话人标注和时间戳
知识点提取.md7.6K按「核心原理 → 执行细节 → 常见误区」结构化整理的知识点
005_对谈武志红_一旦拥有主体性人生会开挂_知识点提取.png1.2MB自动生成的思维导图,一张图看清全部知识结构
完整问答.md49K17 个深度问题 + 完整答案,覆盖播客所有核心要点
AI提炼的思维导图:
005_对谈武志红_一旦拥有主体性人生会开挂_知识点提取

甚至我们还可以让AI在NotebookLM自动生成一份哆啦A梦风格的PPT:
https://i.brmys.cn/file/1770808092999_主体性让人生开挂.pdf

一集 31 分钟的播客,产出了将近 100K 的学习材料。


这套流程用到了什么

在讲具体流程之前,先简单介绍几个关键工具。

Claude Code

Claude Code 是 Anthropic 出的一个命令行 AI 助手。你可以把它理解成一个住在你终端里的超级助手——它能读写文件、执行命令、操作浏览器,而且你可以用自然语言跟它对话。

Skill(技能)

Skill 是 Claude Code 的一个概念,类似于给 AI 写的操作手册。你把一套复杂流程的每个步骤都写清楚,存成一个文件,以后只要触发这个 Skill,Claude Code 就会按照手册一步步执行。

比如这次的「小宇宙深度学习」就是一个 Skill。我把 6 个阶段、20 个步骤全部写在一份文档里。下次再学一集新播客,我只要说一句话,它就知道该怎么做。

用到的外部工具

工具用途链接
通义听悟阿里的音频转文字服务,准确率很高tingwu.aliyun.com
NotebookLMGoogle 的 AI 笔记本,上传文稿后可以对内容提问notebooklm.google.com
AmyMindAI 思维导图工具,粘贴文本自动生成思维导图app.amymind.com
Playwright浏览器自动化工具,Claude Code 用它来操作网页-

完整流程:6 个阶段

下面是整个流程的详细拆解。

第一阶段:从小宇宙下载音频

问题: 小宇宙没有提供直接的下载按钮,常用的下载工具(比如 yt-dlp)也不支持小宇宙。

解决方案: 用 Playwright 自动打开小宇宙的播客页面,从网页的 <audio> 标签里提取出音频文件的真实地址,然后用 curl 下载。

具体来说,Claude Code 会:

  1. 用浏览器打开小宇宙的播客页面
  2. 从页面代码里找到音频地址(格式类似 https://media.xyzcdn.net/xxx.m4a
  3. 同时抓取播客标题、节目名称、时长等信息
  4. 把音频文件下载到本地

实测中,那集武志红的播客音频大小是 57MB。

第二阶段:用通义听悟把音频转成文字

音频下载好之后,需要把它转成文字。

Claude Code 会用 Playwright 操作浏览器,自动完成以下步骤:

  1. 打开通义听悟
  2. 检查是否已有这个音频的转写记录(避免重复转写)
  3. 如果没有,点击「上传音视频」,把音频文件传上去
  4. 等待转写完成(31 分钟的音频大约需要 2-3 分钟)
  5. 导出 .docx 格式的文稿

通义听悟的转写质量很好,能自动识别说话人,还带时间戳。

第三阶段:把文稿转成 Markdown 笔记

通义听悟导出的是 Word 文档(.docx),我需要的是 Markdown 格式(在 Obsidian 里方便查看和关联)。

Claude Code 会:

  1. 用 Python 把 .docx 文件的内容提取出来
  2. 加上笔记的元信息(标题、来源、播客名、小宇宙链接、通义听悟链接等)
  3. 保存为 .md 文件到我的 Obsidian 笔记库里

最终生成的文稿文件长这样:

标题:005|对谈武志红:一旦拥有主体性,人生会开挂!
来源:小宇宙
播客:贵人介绍所
时长:31:01

---

发言人 00:02
大家好,欢迎来到贵人介绍所......

发言人 01:15
我们今天请到的嘉宾是武志红老师......

第四阶段:用 NotebookLM 提取知识点

这是整个流程最有价值的部分之一。

NotebookLM 是 Google 做的一个 AI 笔记本工具。你把一份文档传进去,它就能基于这份文档回答你的问题——而且只会根据文档内容回答,不会瞎编

Claude Code 会:

  1. 把上一步生成的文稿上传到 NotebookLM,创建一个新的笔记本
  2. 读取我事先写好的「知识点提取」提示词
  3. 把提示词发给 NotebookLM

我的提示词要求它:

  • 扮演一位知识管理专家
  • 按照「核心原理 → 执行细节 → 常见误区」的结构来整理
  • 不允许省略任何具体的工具、方法论、书籍或案例
  • 最后要自检有没有遗漏

NotebookLM 返回的结果直接保存,一个字都不改

这一集播客,它帮我整理出了 4 大模块:

  • 第一模块:主体性的起源与内核(真实自体 vs 虚假自体)
  • 第二模块:高手的做事逻辑(感觉做事 vs 思维做事)
  • 第三模块:破解「全能自恋」与完美主义
  • 第四模块:重建主体性的实操路径

每个模块都有核心原理、具体案例、常见误区,结构非常清晰。

第五阶段:自动生成思维导图

知识点提取完之后,Claude Code 会把它变成一张思维导图,方便一眼看清整体结构。

它使用的是 AmyMind——一个 AI 思维导图工具,支持粘贴文本直接生成思维导图。

具体操作:

  1. 用浏览器打开 AmyMind
  2. 点击「新建」→「粘贴文本」
  3. 把知识点提取的内容粘贴到「您的文字」输入框
  4. 把思维导图格式要求粘贴到「提示词」输入框
  5. 点击「生成」,等待 AI 生成思维导图
  6. 生成完毕后,点击「导出」→「Image .png」→「下载原图」
  7. 把下载的图片移动到笔记目录

最终得到一张完整的思维导图,四个模块的知识结构一目了然。

这一步有个小坑:AmyMind 导出的文件名不是播客标题,而是固定叫 null.png。所以需要根据文件的下载时间来识别哪个是刚导出的文件,然后重命名。

第六阶段:递归提问,生成完整问答

这是信息密度最高的一步。

Claude Code 会:

  1. 让 NotebookLM 针对播客内容生成 15-20 个问题,覆盖受访者背景、主要观点、关键故事、人生经历、金句名言等各个维度
  2. 然后逐个问题单独提问,获取每个问题的完整答案
  3. 把所有问答整理成一份带目录的完整文档

这一集播客,NotebookLM 生成了 17 个问题,比如:

  • Q1:缺乏主体性的三种典型状态是什么?
  • Q4:希望工程中跑调小男孩为什么获得了最热烈的掌声?
  • Q7:感觉做事 vs 思维做事的核心区别是什么?
  • Q10:广州女孩追求绝对完美为何走向自我毁灭?

每个问题都有详细的完整答案,最终这份问答文档有 49K——比原始文稿还要长。因为 NotebookLM 在回答时会引用文稿中的具体内容,并进行解释和分析。

所有答案同样原封不动保存,不做任何改动。

总结

这套流程把「听播客」从一次性的消费行为,变成了可沉淀、可检索、可回顾的学习过程。

一集 31 分钟的播客,自动产出:

  • 一份完整文稿,随时可以回查原文
  • 一份结构化的知识点提取,按模块整理好
  • 一张思维导图,一眼看清知识全貌
  • 一份 17 问的深度问答,覆盖所有核心要点

以前听完一集播客,脑子里只剩个模糊的印象。现在我的笔记库里有了一套完整的学习材料,任何时候想复习,翻开就能看。

这才是「深度学习」一集播客该有的样子。