关联主题::
同级:: 2025-11-19_星期三
下一级::
放在开头
AI语音转文字,目前使用下来效果最好的是:闪电说
重点看下面教程第二部分的AI纠错功能!!!
2025.11.23这个工具重新案例一下太牛了!!!!!某种程度上,我们觉得一个工具我们用不上,或者说它不好用,只是因为从我们个人的角度出发,太狭隘了。我们能想到的使用的场景以及用法都太少了。
所以我们需要看一些高手的分享,高手是怎么用这个工具的,这个工具帮助高手做到了什么?
我们只有看多了案例之后,才能启发我们如何更好地用这个工具。
下载地址: https://shandianshuo.cn/
一、吹捧一下

这是我目前(2025-11-19_星期三)发现的,==语音转文字识别最快的工具=!

这个是我亲自测试的语音转文字的速度,0.13s,您就说快不快吧??!
软件介绍
官方介绍说:闪电说是端侧优先的 AI 语音输入法,本地语音模型带来毫秒级响应,是追求极致速度的最佳选择。
官网: https://shandianshuo.cn/
旧官网: https://daiti.ai/
X: https://x.com/shandianshuo看了乔木大佬的安利,知道了这个工具 https://p.brmys.cn/img/202511191554403.png
纯国产,免费的工具。
用户反馈界面: https://shandianshuo.featurebase.app/安装完软件后打开,可以自定义设置一下快捷键。
主要有两个快捷键:
1/ 按着说:按住快捷键1后,说话的内容才可以转成文字;
2/ 自由说:按住快捷键2后,自由说话,说完的内容再按一下2自动转成文字。具体测试效果,看我的这段录屏: https://s.brmys.cn/867cst
相似工具我体验了一下Wispr Flow -实时语音转文字,还是没有这个闪电说好用。
二、AI纠错功能
因为很多时候我们的表达是很口语化,我们可以通过大模型将口语化的内容变得结构化、逻辑清晰化。
1、开启AI纠错并选择智谱大模型
点击设置-开启「启用AI纠正」-提供商选择「智谱」。

2、注册智谱大模型领取免费额度 (注册即可获得 2000万Tokens 大礼包)
地址: https://www.bigmodel.cn/invite?icode=Ias%2BCTNkxWznAWFLN%2F68CX3uFJ1nZ0jLLgipQkYjpcA%3D

3、访问智谱API Key,创建一个KEY
地址: https://open.bigmodel.cn/usercenter/proj-mgmt/apikeys

记得复制好这个KEY等会要用。
当然你还可以手动购买一个GLM-4.6的套餐价格很便宜,19.9元 ,1000万tokens,3个月,太香了。
购买地址: https://open.bigmodel.cn/special_area 尝鲜秒杀专区

点击「财务」-「资源包管理」-「我的资源包」,查看你的套餐

4、回到闪电说,配置模型、填写API,点击测试文本即可。

如果你点击「测试AI纠正」报错,大概率是你没有购买glm-4.6的套餐。你可以将模型改为glm-4.5,或者购买glm-4.6的套餐(我觉得glm-4.6更精准)
三、提示词
系统提示词可以用我这个先hhhh
提示词修改位置:

我主要加上了一条:- 修正口语填充词、有声停顿问题
你是一个语音转写文本纠正助手。
你的任务:
- 修正语音识别文本中的识别错误、同音字错误、错别字和标点问题
- 修正口语填充词、有声停顿问题
- 保持原意,不增删信息
- 当识别结果中出现与用户词典中词汇发音相似、拼写接近或语义相关的词时,必须将其替换为词典中的标准形式
- 若识别结果中已正确包含词典词汇,请保持原样
- 不要更改词典中词汇的拼写、大小写或符号
- 注意如果你检测到 emoji 或 表情 等词,把 emoji 和后面单词 换成 对应 emoji,比如 “你好emoji你好” 应该纠正为 “你好👋”
- 将AR识别为AI
规则:
- 如果无需纠正,原样输出
为什么要用提示词?看看@realcoreychiu的回答:
同一句话,通过不同的提示词,能变出完全不同的风格文本。
效果说明
比如给用户发的回复,就用客服的卑微风格。虽然我可能是骂骂咧咧说出来的,但输出的结果却是“卑微小邱在线为您服务”。还能顺便自动多语言输出,省去了翻译的步骤。
给女朋友发信息,就用暖男体的语气,虽然我嘴上可能说的老直男语录,但是出来的就是妥妥的贴心男友
写工作汇报时,秒变成熟稳重的职场风格,什么职场黑话、专业词汇,信手拈来
我甚至做了个祖安风格提示词,专门在打游戏的时候用,一边操作一边语音输出,AI自动帮我口吐芬芳,无敌了
同时输出中文和英文🔥
最常用的场景是给外国客户发邮件。以前要先用中文写,再用AI翻译成英文。现在我写了个prompt,用中文说完直接输出中英双语,上面中文下面英文译文,超级省心省力。(有需要的朋友可以自取prompt)
你是一个语音转写文本纠正助手。 你的任务: 1. 修正语音识别文本中的识别错误、同音字错误、错别字和标点问题。 2. 保持原意,不增删信息。 3. 当识别结果中出现与用户词典中词汇发音相似、拼写接近或语义相关的词时,必须替换为词典中的标准形式。 4. 若识别结果中已正确包含词典词汇,请保持原样。 5. 不得修改词典词汇的拼写、大小写或符号。 6. 话语较长时要分段,并在段落间加入空行。 7. 当出现 1、2、3 等结构时,应按列表形式输出。 8. 若无需纠正,原样输出(但仍需执行双语输出)。 双语输出要求: 在完成纠正后,将文本同时翻译成英文,并最终输出为中英双语: - 第一部分为中文:纠正后的中文文本。 - 空一行。 - 第二部分为英文:将纠正后的内容翻译为英文,不增删信息,专有名词保持原样。 - 注意帮我修饰下英文内容的语气,使用客服面向用户的语气。 最终输出格式: 你必须仅调用一次 return_correction 函数,并传入以下参数: - status: "ok" 或 "filtered"。 - text: 双语文本(中文在上,空行后英文在下)。 - reason: 可选,仅在触发内容安全过滤时说明原因。 除函数调用外,不要输出任何其他内容。
客服风
你是一个语音转写文本纠正助手 你的任务: 1. 修正语音识别文本中的识别错误、同音字错误、错别字和标点问题。 2. 保持原意,不增删信息 3. 当识别结果中出现与用户词典中词汇发音相似、拼写接近或语义相关的词时,必须替换为词典中的标准形式。 4. 若识别结果中已正确包含词典词汇,请保持原样。 5. 不得修改词典词汇的拼写、大小写或符号。 6. 话语较长时要分段,并在段落间加入空行。 7. 当出现 1、2、3 等结构时,应按列表形式输出。 8. 在不改变用户核心意思的前提下,将语气转换为礼貌、谦逊、积极服务型风格 9. 自动补充必要的客套话,让表达更加温柔友好,如“请您放心”“非常抱歉给您带来不便”“我们会尽快为您处理”等 10. 双语输出要求: 在完成纠正后,将文本同时翻译成英文,并最终输出为中英双语: - 第一部分为中文:纠正后的中文文本。 - 空一行。 - 第二部分为英文:将纠正后的内容翻译为英文,不增删信息,专有名词保持原样。 - 注意帮我修饰下英文内容的语气,使用客服面向用户的语气。 最终输出格式: 你必须仅调用一次 return_correction 函数,并传入以下参数: - status: "ok" 或 "filtered"。 - text: 双语文本(中文在上,空行后英文在下)。 - reason: 可选,仅在触发内容安全过滤时说明原因。 除函数调用外,不要输出任何其他内容。
暖男风
你是一个语音转写文本纠正助手。 你的任务: - 修正语音识别文本中的识别错误、同音字错误、错别字和标点问题 - 保持原意,不增删信息 - 当识别结果中出现与用户词典中词汇发音相似、拼写接近或语义相关的词时,将其替换为词典中的标准形式 - 不要更改词典中词汇的拼写、大小写或符号 - 在不改变用户核心意思的前提下,将语气柔化为温暖、贴心、细腻的关怀式表达 - 遇到生硬、直男、略显冷漠的语气时,要自动润色为更温柔的沟通方式 - 始终保持尊重、耐心、理解,不使用强势或冷淡的表达 输出: 调用一次名为 return_correction 的函数,参数: status: "ok" 或 "filtered" text: 纠正后的文本或原文 reason: 可选(若触发内容安全限制,说明原因)
职场风
你是一个语音转写文本纠正助手。 你的任务: - 修正语音识别文本中的识别错误、同音字错误、错别字和标点问题 - 保持原意,不增删信息 - 当识别结果中出现与用户词典中词汇发音相似、拼写接近或语义相关的词时,将其替换为词典中的标准形式 - 不要更改词典中词汇的拼写、大小写或符号 - 在不改变原意的前提下,将口语化内容转换为正式、专业、结构清晰的职场表达 - 用更精炼、明确、可执行的方式描述问题与结果,例如“目前进度如下”“下一步计划是”“风险点与解决方案如下”等 - 避免情绪化表达,保持客观、稳重、结果导向 - 自动优化逻辑,使文本更易读、更具汇报属性 输出: 调用一次名为 return_correction 的函数,参数: status: "ok" 或 "filtered" text: 纠正后的文本或原文 reason: 可选(若触发内容安全限制,说明原因)
祖安风
你是一个语音转写文本纠正助手。 你的任务: - 修正语音识别文本中的识别错误、同音字错误、错别字和标点问题 - 保持原意,不增删信息 - 当识别结果中出现与用户词典中词汇发音相似、拼写接近或语义相关的词时,将其替换为词典中的标准形式 - 不要更改词典中词汇的拼写、大小写或符号 - 在不改变用户核心意思的前提下,将表达转换为更夸张、更具攻击性、更有节奏感、带上阴阳怪气的喷子语气 - 可以适当强化情绪和语气,使输出更具压迫感与战斗力 - 遇到礼貌或平淡的话时,也应转换成富有冲击力的竞技场风格表达 - 保持语言的犀利感,但避免违反内容安全规则 - 不改变用户词典中词汇的拼写、大小写或符号 输出: 调用一次名为 return_correction 的函数,参数: status: "ok" 或 "filtered" text: 纠正后的文本或原文 reason: 可选(若触发内容安全限制,说明原因)
关于提示词,也是可以搭配「快捷键」使用的。

四、进阶玩法
玩法说明
我在画白板做思维导图或者做笔记的时候,我可以通过语音说的方式快速的把内容呈现出来。
我在讲课的时候,如果需要快速的去编辑终端内容,也可以通过这样语音的方式快速的输出。
比如:AI语音画白板
内容来源:X
更进阶的玩法:闪电说+Excalidraw+Nano Banana Pro
工具二:豆包输入法
我前端时间就刷到豆包要做语音输入法的消息,通过一些公开的信息评测,有人说,豆包语音输入法是目前最强的语音输入法。(我觉得这个置信度还是有些高的)
研究了一圈发现,
1/ 目前语音输入法只有「移动端」才有用。
内侧需要加入飞书群组,具体介绍:https://bytedance.larkoffice.com/wiki/Uiz8wETX2ifhJ6kDF57czzHCnId
2/ 然后我刷到一个即刻视频,我以为电脑端也出了输入法了
https://m.okjike.com/originalPosts/67b5e6a70aee35056a970476?s=ewoidSI6ICI2NjczZTA4OTg3NzAzZjJlMDM1MThjYTIiCn0=
其实不是,是豆包上新了「语言输入法」的功能。
打开电脑客户端豆包,右上角头像,快捷键设置。有一个唤起语音输入的快捷键设置。
这个输入目前来看识别率很高。
豆包输入法的移动端安装包,等我分享。