语音识别学习篇

语音识别

探索ing

anaconda工具
anaconda的虚拟环境创建管理

anaconda安装不同版本python
pip下载时换源

Hanlp是什么?

开源,主要做的是语言模型,将语音识别得到的内容组合成句子,句义分析。

PyAudio库

可以调用麦克风录音。
关于anaconda(python3.7)下载pyaudio失败问题(缺乏VC14.0),需要下载一个whl文件

如果是从anaconda里安装的环境,一定要在这个环境的目录下执行上面链接的指令。(包括下载的whl文件也要放到那个虚拟环境对应的目录下。
比如:我的虚拟环境名称为ym,那么虚拟环境的目录就是 : …/anaconda/envs/ym.

pytorch语音识别

一个tensorflow,一个pytorch,我都不懂,555。
pytorch中文网站
有一个github的工程,可以借鉴一下:基于深度学习的中文语音识别

百度AI自训练:短语音识别

醉了。文本要GBK,在记事本里改格式为GB2312也不行。另存为:格式选ANSI就好了。
音频就不那么容易了,得下载一个ffmepg软件,

ffmepg获取安装:一定要选对(windows的不要选linux版本的下载,两者使用方法不一样。下载后解压,添加环境变量Path: …/解压的目录/bin。

ffmepg指令:摘取其中一条:

转16k 16bit单通道音频格式
ffmpeg -y -i 文件名.wav -acodec pcm_s16le -f s16le -ac 1 -ar 16000 文件名.pcm

复制粘贴到cmd命令提示符窗里运行(记得改文件名,路径也要对)

what`s a wave look like

准备就绪,开始上传文件,自训练。

参照百度AI的手册,下载对应的库。参考手册
迷,pip install baidu-aip的时候,出现了问题,把杀毒软件(电脑管家关掉就好了,我真…)

训练完之后,用pyaudio录音,保存,并和百度AI的接口作比较,得到识别结果。
参考以下链接:
利用百度ai接口做语音识别
利用百度AI进行语音合成

PYNQ实现语音识别

PL语音信号采集+PS端语音识别(调用百度API)

PYNQ项目-智能音箱

PL语音信号采集+语音识别(LSTM)

FPGA在深度学习的未来
深入理解LSTM神经网络

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值