英文数字语音识别

例子代码链接:https://github.com/pannous/tensorflow-speech-recognition
我在百度网盘备份的链接:https://pan.baidu.com/s/1dcphCTog9TTypcPhZ1xQXQ
提取码:1234
复制这段内容后打开百度网盘手机App,操作更方便哦
里面不但有程序代码还有数据集为:spoken_numbers_pcm.tar和spoken_numbers_spectros_64x64.tar,位于主文件夹,如下图:
在这里插入图片描述
这个数据集包含许多人阅读的0–9的英文的音频。分为男生和女声,一段音频中只有一个数字对应的英文的声音。
直接在主文件夹中建立data文件夹,并把这两个数据集拷贝到data文件夹中,解压并保留tar文件,程序直接读的就是tar文件,但程序中可能应付不了tar文件,所以也要解压一份备给傻冒程序。
在这里插入图片描述
此程序用的是前面那个数据集,后面的哪个干嘛用的没发现。然后运行number_classifier_tflearn.py,根据程序要求,如下图:
在这里插入图片描述
拷贝spoken_numbers_pcm.tar文件夹中的一个5_Vicki_260.wav声音文件到主文件夹speech下,结果如下:
在这里插入图片描述
成功识别出所说的英文数字是5。运行的很快,也不用加载模型文件,直接训练直接用的。

  • 2
    点赞
  • 13
    收藏
    觉得还不错? 一键收藏
  • 6
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 6
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值