Python离线语音识别高准确率方案分析及代码实现

置顶 lytcreate.

已于 2024-05-21 17:02:49 修改

阅读量1.3k

点赞数 26

分类专栏： Python 离线语音识别文章标签：前端 javascript 数据库

于 2024-04-10 17:37:23 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_35204012/article/details/137604934

版权

Python 同时被 2 个专栏收录

54 篇文章 1 订阅

订阅专栏

离线语音识别

1 篇文章 0 订阅

订阅专栏

背景：

随着信息技术的飞速发展和人工智能的广泛应用，语音识别技术已成为现代通信和人机交互领域的重要组成部分。离线语音识别技术，作为语音识别的一个分支，因其无需实时连接网络、保护用户隐私等特性，在特定场景中发挥着越来越重要的作用。

离线语音识别技术主要指的是在没有网络连接的情况下，设备能够利用本地算法和模型对用户的语音输入进行识别并转化为文字或指令。这种技术适用于那些网络环境不稳定或无法连接网络的场景，如偏远地区、地下空间、飞机上等。在这些场景下，离线语音识别技术能够提供便捷、高效的语音交互体验，满足用户的多样化需求。

以下是三种关于Python实现基于 SpeechRecognition 的离线语音识别方案，其中最后一种亲测识别率达到99%。

注：本文所有代码全在linux服务器环境下执行，Windows下请酌情进行修改

用到的测试文件：err.mp3或者err.wav文件

语音原内容是：不要着急哈，可能出现了一点问题，请稍后再试~

首先，需要安装使用到的库：SpeechRecognition

pip3 install SpeechRecognition

方案一：使用Google Speech API

优点：识别率较高，无需任何API_KEY限制

缺点：因使用谷歌服务，需要网络环境支持

代码实现：

import speech_recognition as sr

r = sr.Recognizer()

# 此处替换自己需要处理的wav文件
test = sr.AudioF

关注

26
点赞
踩
29

收藏

觉得还不错? 一键收藏
打赏
0
评论
Python离线语音识别高准确率方案分析及代码实现

Python离线语音识别多种方案代码实现及实测对比，其中最准确的识别率高达99%
复制链接

扫一扫

专栏目录

lytcreate. CSDN认证博客专家 CSDN认证企业博客

码龄8年

212: 原创

9244: 周排名

1万+: 总排名

6万+: 访问

: 等级

2853: 积分

619: 粉丝

699: 获赞

13: 评论

377: 收藏

私信

关注

热门文章

分类专栏

最新评论

web网站打包exe可执行程序
rllmqe: https://blog.csdn.net/rllmqe/article/details/135891812 我有一个简单的，多内核选择打包
微信AI机器人使用说明-2024最新版
lytcreate.: 可以联系我加好友免费体验~
Python把excel内容保存为图片（非统计图而是纯原表格数据）
阿不从: 简单又好用。爆赞。
mysql集群NDBcluster引擎在写入数据时报错 (1114, “The table ‘ads‘ is full“)
普通网友: 引领技术潮流，是不可多得的好文，十分值得借鉴和参考。期待博主未来能够持续分享更多好文【我也写了一些相关领域的文章，希望能够得到博主的指导，共同进步！】
silk-v3-decoder将sil转为mp3
lytcreate.: 给你点转换的代码你参考下：file_path = os.path.join(ROOT_PATH, 'media', f'{uuid.uuid4().hex}.mp3') with open(file_path, 'wb') as fd: fd.write(base64.b64decode(data)) os.system(f"ffmpeg -y -i {file_path} -f s16le -ar 24000 -ac 1 {file_path.split('.')[0]+'.pcm'}") os.system(f"{SILK_PATH}/silk/encoder {file_path.split('.')[0]+'.pcm'} {file_path.split('.')[0]+'.sil'} -tencent")

最新文章

2024

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

lytcreate. 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。