关联主题::
同级:: 2025-12-15_星期一
下一级::
我有这么一个困惑:
比如,很多音频(如播客),视频(对谈、会议录屏、课程)等等,
如果是几个小时的内容,很长的内容。
其实如何有效吸收是一个很大的问题。
一个有效的策略是,将音视频转文稿,然后再去吸收。
但是音视频转文稿的内容,其实可读性挺差的,如果你手动再进行排版,或者你压根不排版只作为素材给AI处理。
我想法是,如何梳理出一份可复用,可读性更高的文字稿?
类似的场景还有:一些对谈界面,播客,深度会议录屏,课程等。
虽然现在语音/音频转文稿的技术很成熟了,但是导出的文稿不能直接使用。
1、语音/视频/音频转文稿,其实已经提高了信息的接收效率了。
🤔信息摄入的效率取决于信息的可预知性。
2、但时候音视频转文稿的内容,
1)不能作为笔记直接使用;
2)即使存档,未来回看的吸收效率也很低;
3)更适合作为素材,让AI阅读进行二次产出;
4)口语化的内容很多,如嗯,啊,这,额…;
5)排版太差,不符合结构化排版。
所以我产生的第一个需求是——
如何在忠实原文,即保障95%的内容不改动的前提下,对文稿进行重新排版?
这样做的目的:
1)这样的内容可以直接直接作为原文摘录使用。(如书籍原文)
2)在此基础上进行划线和写自己的感受。(沉淀自己的思考和下一步行动)
3)由于是自己参与加工过的原文,自己在学的时候也会专注。
所以我的思路是:
001 音视频上传通义听悟;
002 下载音视频转文稿,让Gemini结合提示词处理成排版后的内容;
003 打开通义听悟,笔记区域粘贴AI处理后的内容;
004 这样就可以形成音频+逐字稿+AI处理后的内容3重对应。
005 省去记笔记的时间,只对自己感兴趣的部分高亮,然后写下思考。
具体我截图↓
在我的学习方法里,摘录和归档原文,一直都是很重要的。

https://tingwu.aliyun.com/doc/transcripts/58gmq6azlg3j9zwo?sl=1# 《魔都“负豪”自曝:亏掉一个亿后才明白,赚钱不是对努力的回报》

这样的话,
1/ 我归档的不是音视频转文稿的内容A,而是AI加工过的重新排版过的原文B。
然后你对着这个B去听,应该效率会特别高。
(因为这个原文B是你参与生产的,你会更在意)
2/ 在原文B基础上,做笔记,写感悟C。
3/ 也可以让AI在A或B的基础上,沉淀结构化的笔记D。
(对于AI而言,A和B应该是没啥差异的)