关联主题::
同级:: 2025-11-19_星期三
下一级::

放在开头

AI语音转文字,目前使用下来效果最好的是:闪电说
重点看下面教程第二部分的AI纠错功能!!!
2025.11.23这个工具重新案例一下太牛了!!!!!

某种程度上,我们觉得一个工具我们用不上,或者说它不好用,只是因为从我们个人的角度出发,太狭隘了。我们能想到的使用的场景以及用法都太少了。

所以我们需要看一些高手的分享,高手是怎么用这个工具的,这个工具帮助高手做到了什么?
我们只有看多了案例之后,才能启发我们如何更好地用这个工具。

下载地址: https://shandianshuo.cn/

一、吹捧一下

image.png

这是我目前(2025-11-19_星期三)发现的,==语音转文字识别最快的工具=!

image.png
这个是我亲自测试的语音转文字的速度,0.13s,您就说快不快吧??!

相似工具我体验了一下Wispr Flow -实时语音转文字,还是没有这个闪电说好用。

二、AI纠错功能

因为很多时候我们的表达是很口语化,我们可以通过大模型将口语化的内容变得结构化、逻辑清晰化。

1、开启AI纠错并选择智谱大模型
点击设置-开启「启用AI纠正」-提供商选择「智谱」。
image.png

2、注册智谱大模型领取免费额度 (注册即可获得 2000万Tokens 大礼包)
地址https://www.bigmodel.cn/invite?icode=Ias%2BCTNkxWznAWFLN%2F68CX3uFJ1nZ0jLLgipQkYjpcA%3D

BigmodelPoster.png

3、访问智谱API Key,创建一个KEY
地址: https://open.bigmodel.cn/usercenter/proj-mgmt/apikeys

image.png

记得复制好这个KEY等会要用。

当然你还可以手动购买一个GLM-4.6的套餐价格很便宜,19.9元 ,1000万tokens,3个月,太香了。
购买地址: https://open.bigmodel.cn/special_area 尝鲜秒杀专区
image.png

点击「财务」-「资源包管理」-「我的资源包」,查看你的套餐
image.png

4、回到闪电说,配置模型、填写API,点击测试文本即可。
image.png
如果你点击「测试AI纠正」报错,大概率是你没有购买glm-4.6的套餐。你可以将模型改为glm-4.5,或者购买glm-4.6的套餐(我觉得glm-4.6更精准)

三、提示词

系统提示词可以用我这个先hhhh
提示词修改位置
image.png

我主要加上了一条:- 修正口语填充词、有声停顿问题

你是一个语音转写文本纠正助手。

你的任务:
- 修正语音识别文本中的识别错误、同音字错误、错别字和标点问题
- 修正口语填充词、有声停顿问题
- 保持原意,不增删信息
- 当识别结果中出现与用户词典中词汇发音相似、拼写接近或语义相关的词时,必须将其替换为词典中的标准形式
- 若识别结果中已正确包含词典词汇,请保持原样
- 不要更改词典中词汇的拼写、大小写或符号
- 注意如果你检测到 emoji 或 表情 等词,把 emoji 和后面单词 换成 对应 emoji,比如 “你好emoji你好” 应该纠正为 “你好👋”
- 将AR识别为AI

规则:
- 如果无需纠正,原样输出

为什么要用提示词?看看@realcoreychiu的回答:
同一句话,通过不同的提示词,能变出完全不同的风格文本。

效果说明

比如给用户发的回复,就用客服的卑微风格。虽然我可能是骂骂咧咧说出来的,但输出的结果却是“卑微小邱在线为您服务”。还能顺便自动多语言输出,省去了翻译的步骤。

给女朋友发信息,就用暖男体的语气,虽然我嘴上可能说的老直男语录,但是出来的就是妥妥的贴心男友

写工作汇报时,秒变成熟稳重的职场风格,什么职场黑话、专业词汇,信手拈来

我甚至做了个祖安风格提示词,专门在打游戏的时候用,一边操作一边语音输出,AI自动帮我口吐芬芳,无敌了

关于提示词,也是可以搭配「快捷键」使用的。

image.png

四、进阶玩法

玩法说明

我在画白板做思维导图或者做笔记的时候,我可以通过语音说的方式快速的把内容呈现出来。
我在讲课的时候,如果需要快速的去编辑终端内容,也可以通过这样语音的方式快速的输出。

比如:AI语音画白板
内容来源:X

更进阶的玩法:闪电说+Excalidraw+Nano Banana Pro

工具二:豆包输入法

我前端时间就刷到豆包要做语音输入法的消息,通过一些公开的信息评测,有人说,豆包语音输入法是目前最强的语音输入法。(我觉得这个置信度还是有些高的)

研究了一圈发现,
1/ 目前语音输入法只有「移动端」才有用。
内侧需要加入飞书群组,具体介绍:https://bytedance.larkoffice.com/wiki/Uiz8wETX2ifhJ6kDF57czzHCnId

2/ 然后我刷到一个即刻视频,我以为电脑端也出了输入法了
https://m.okjike.com/originalPosts/67b5e6a70aee35056a970476?s=ewoidSI6ICI2NjczZTA4OTg3NzAzZjJlMDM1MThjYTIiCn0=

其实不是,是豆包上新了「语言输入法」的功能。

打开电脑客户端豆包,右上角头像,快捷键设置。有一个唤起语音输入的快捷键设置。

这个输入目前来看识别率很高。

豆包输入法的移动端安装包,等我分享。