用Kaldi在TIMIT上跑Speech Adaptation 和 Gender Dependent遇到的坑

最新推荐文章于 2024-05-25 11:16:24 发布

捧哏艺术家

最新推荐文章于 2024-05-25 11:16:24 发布

阅读量432

点赞数

分类专栏：语音识别文章标签： Kaldi 语音识别 Speech Adaptation

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_39035868/article/details/88707221

版权

这个是啥

这个博客主要用来记录在爱丁堡大学读Speech and Language Processing的硕士时上过的一些课程。我自己本人是国内普通211汉语言学本科的，相关的背景也比较薄弱，还望各位多担待。

TIMIT是很多研究Kaldi的旁友经常接触到的语料库，网上也有不少介绍在Kaldi上跑TIMIT的文章，我个人觉得比较详细的是以下这篇：
Kaldi完美运行TIMIT完整结果（含DNN）

上面这篇文章把/egs/timit/s5/run.sh里的内容基本上介绍了一遍，Dan Povey本人在Google的group上也经常会让提问的人回去研究一下这些类似于‘范例’一样的脚本，这是学习Kaldi的一个好途径。【也是我完成这个作业的一个小捷径。

这里主要介绍一下我在完成这份作业时遇到的几个小坑，基本上都是我在作业中遇到的，而且国内论坛没怎么见人提到过的。

语言模型

Kaldi主要是用来做文字级别的识别，即word recognition，同时也能拿来做音素级别的识别，也就是phone recognition。这个主要是在数据准备的阶段完成，Kaldi会根据data中提供的字典生成语言模型。我们可以通过查看data/lang/word 这个文件的内容来判断，如果里面的是音素，那就是做音素级别的识别，反之则是文字级别的。

这个在训练之前要注意一下，同时也要保证data/train/text和data/test/text这两个文件里的大小写要和上面提到的data/lang/word一致。

这个大概就是语言模型容易遇到的坑，建议留神࿰

最低0.47元/天解锁文章

捧哏艺术家

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
用Kaldi在TIMIT上跑Speech Adaptation 和 Gender Dependent遇到的坑

这个是啥这个博客主要用来记录在爱丁堡大学读Speech and Language Processing的硕士时上过的一些课程。我自己本人是国内普通211汉语言学本科的，相关的背景也比较薄弱，还望各位多担待。TIMIT是很多研究Kaldi的旁友经常接触到的语料库，网上也有不少介绍在Kaldi上跑TIMIT的文章，我个人觉得比较详细的是以下这篇：Kaldi完美运行TIMIT完整结果（含DNN）...
复制链接

扫一扫

专栏目录

捧哏艺术家 CSDN认证博客专家 CSDN认证企业博客

码龄7年

1: 原创

200万+: 周排名

198万+: 总排名

432: 访问

: 等级

16: 积分

0: 粉丝

0: 获赞

1: 评论

0: 收藏

私信

关注

热门文章

用Kaldi在TIMIT上跑Speech Adaptation 和 Gender Dependent遇到的坑 432

分类专栏

语音识别 1篇

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。