语音识别学习篇

最新推荐文章于 2022-08-24 12:10:45 发布

木兮梓淅伏所伊

最新推荐文章于 2022-08-24 12:10:45 发布

阅读量682

点赞数 1

文章标签： python 语音识别

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_44404407/article/details/104641362

版权

文章目录

- 语音识别

语音识别

探索ing

anaconda工具

anaconda的虚拟环境创建管理

anaconda安装不同版本python
pip下载时换源

Hanlp是什么？

开源，主要做的是语言模型，将语音识别得到的内容组合成句子，句义分析。

PyAudio库

可以调用麦克风录音。
关于anaconda(python3.7）下载pyaudio失败问题（缺乏VC14.0），需要下载一个whl文件

如果是从anaconda里安装的环境，一定要在这个环境的目录下执行上面链接的指令。（包括下载的whl文件也要放到那个虚拟环境对应的目录下。
比如：我的虚拟环境名称为ym，那么虚拟环境的目录就是 : …/anaconda/envs/ym.

pytorch语音识别

一个tensorflow,一个pytorch，我都不懂，555。
pytorch中文网站
有一个github的工程，可以借鉴一下：基于深度学习的中文语音识别

百度AI自训练：短语音识别

醉了。文本要GBK，在记事本里改格式为GB2312也不行。另存为：格式选ANSI就好了。
音频就不那么容易了，得下载一个ffmepg软件，

ffmepg获取安装：一定要选对（windows的不要选linux版本的下载，两者使用方法不一样。下载后解压，添加环境变量Path: …/解压的目录/bin。

ffmepg指令：摘取其中一条：

转16k 16bit单通道音频格式
ffmpeg -y -i 文件名.wav -acodec pcm_s16le -f s16le -ac 1 -ar 16000 文件名.pcm

复制粘贴到cmd命令提示符窗里运行（记得改文件名，路径也要对）

what`s a wave look like

准备就绪，开始上传文件，自训练。

参照百度AI的手册，下载对应的库。参考手册
迷，pip install baidu-aip的时候，出现了问题，把杀毒软件（电脑管家关掉就好了，我真…）

训练完之后，用pyaudio录音，保存，并和百度AI的接口作比较，得到识别结果。
参考以下链接：
利用百度ai接口做语音识别
 利用百度AI进行语音合成

PYNQ实现语音识别

PL语音信号采集+PS端语音识别（调用百度API）

PYNQ项目-智能音箱

PL语音信号采集+语音识别（LSTM）

FPGA在深度学习的未来
 深入理解LSTM神经网络

木兮梓淅伏所伊

关注

1
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。