根据标注区域提取需要部分的语音特征参数

最新推荐文章于 2023-02-28 17:11:57 发布

JamesJuZhang

最新推荐文章于 2023-02-28 17:11:57 发布

阅读量2.7k

点赞数

分类专栏： Speech Recognition 文章标签： HTK MFCC 特征参数提取

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/jojozhangju/article/details/21459737

版权

Speech Recognition 专栏收录该内容

29 篇文章 13 订阅

订阅专栏

这两天终于腾出时间梳理一下之前做的实验，在针对语音特征参数MFCC，做线性判别分析LDA的时候需要对每一帧MFCC打上标签，才能完成LDA的有监督学习，满足我使用LDA的变换需求。

但是一般情况下，由语音文件WAV提取的MFCC中，既包含了安静的部分，又包含了说话的部分，怎样才能提取到相应需要的部分呢，经过了几天的实验，以下是实现的方法：

第一步：对wav文件进行标注

比如文件内容中包含了孤立词“八”，然后对wav文件进行标注，保存成lab文件。如下所示：

lab文件内容如下：

第二步：使用HTK进行参数提取：

这里我们要用到HTK工具包中的HCopy工具来进行参数提取。

执行：

HCopy -T 4 -L ./data/lab -n 2 2 -C config -S word.scp

其中：

-T是用来输出信息，-T 4是用来输出的信息为：segment boundaries computed from label files

-L ./data/lab 在指定的文件夹下寻找需要提取特征参数文件的同名lab文件

-n 是按照lab文件中的标签来提取MFCC，如 -n 2 2 是表示提取第二标签 -n 1 2是表示提取第一和第二个标签等

-C config 是提取特征参数所要遵循的参数设置

word.scp是参数提取文件和保存文件的路径列表

例：我们需要提取wav中“八”部分的MFCC参数，我们需要执行命令：

HCopy -T 4 -L ./lab -n 2 2 -C config ba.wav ba.mfc

我们可以看到：

这样我们所需要的部分就提取出来了：

第三步：查看提取的MFCC

执行：HList -h -o ba.mfc > ba.txt

以上就是根据标注区域提取需要部分的语音特征参数。

关注

0
点赞
踩
4

收藏

觉得还不错? 一键收藏
2
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论 2

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。