sphinx4 声学模型自适应

最新推荐文章于 2020-02-06 15:56:27 发布

hezhourongro

最新推荐文章于 2020-02-06 15:56:27 发布

阅读量2.5k

点赞数

分类专栏：语音识别工具箱

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/hezhourongro/article/details/9060157

版权

语音识别工具箱专栏收录该内容

3 篇文章 0 订阅

订阅专栏

如果你没有足够的数据去训练自己的声学模型，那么做自适应训练会比自己直接训练新的声学模型更好，5分钟的自适应语音就可以达到很好的效果，这是官方维基教程指出的，在谷歌上搜 spinx4 adapt 就可以找到wiki教程，如果你打不开这个网页，那就用代理翻墙，我就是这么干的。

sphinx4和pocketsphinx的自适应训练有一些地方会有所不同，这是因为pocektsphinx的声学模型是半连续的，而sphinx4的声学模型是连续的。

做自适应训练的语料最理想的是包含你要识别的大部分音素单元，即包含的音素要丰富。做自适应训练所要的有：句子列表，描述句子列表当中单词发音的词典，与句子对于的语音数据。这里要注意的是语音数据的采样率必须是16KHz，单声道。接下来就开始制作自适应模型，在这之前确保已经编译了sphinxBase和sphinxTrain。

首先把已有的声学模型拷贝到当前的工作路径下，用sphinxBase的sphinx_fe 工具提取语音数据的声学模型特征数据，第二步用sphinxTrain当中的bw工具从自适应数据当中收集统计数据。bw命令中的参数应该和feat.params文件中的参数匹配，并且bw也不是完全支持此文件当中的参数，不支持的就跳过就可以了。第三步，收集完统计数据之后，就可以用MLLR方法或者MAP方法更新声学模型了，这是两个不同的方法，对应的工具是mllr_solve 和map_adapt ,通过这两个工具之后的声学模型就是自适应声学模型了，这样声学模型就大功告成了，接下来要做的就是测试了。

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
2
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

hezhourongro CSDN认证博客专家 CSDN认证企业博客

码龄12年

3: 原创

55万+: 周排名

33万+: 总排名

9万+: 访问

: 等级

375: 积分

8: 粉丝

27: 获赞

3: 评论

37: 收藏

私信

关注

热门文章

分类专栏

最新评论

最大似然估计算法（简单，通俗易懂）
尹子龙: P(Data | M)，请问70次是白球的概率不应该是二项分布吗？
sphinx4 声学模型自适应
hezhourongro: 恩，我以前用的时候，确实遇到过，假如你运行命令 HSLab any_name.sig，出现你说的错误，就先运行 start vcvars32.bat 再运行HSLab any_name.sig,如果还出现错误,那先运行以下自带的HTKDemo ,再运行 start vcvars32.bat 再运行HSLab any_name.sig.，希望这样能解决，我现在已经好久不用HTK了，都在用spinx4
sphinx4 声学模型自适应
ziyuzhao123: 你好，我看你也在学HTK,在编译HTK中，那个HSLab这个不可用，按照网上的修改后，就出现：按下 Rec键准备录音的时候，命令行弹出错误：StartAudi:Requested data format is not supported [ERR=2] FATAL ERROR-Terminating program HSLab 这样的错误，不知道你当时是怎么解决的，能否说一下你的方法。不胜感激！

大家在看

最新文章

目录

评论 2

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。