计算语音识别结果编辑距离的开源软件:sclite的编译、安装与运行

一、【下载】

sclite的下载网站是:http://www.itl.nist.gov/iad/mig/tools/

二、【编译】

1:首先解压sctk-2.4.0-20091110-0958.tar.bz2,并进入解压后的目录sctk-2.4.0

2.:将源码中以下几处Filter::Filter,改为::Filter

src/asclite/core/recording.cpp:157:     map<string, Filter::Filter*>::iterator fi, fe;

src/asclite/core/recording.cpp:164:             Filter::Filter* ptr_elt = fi->second;

src/asclite/core/recording.h:122:        map<string, Filter::Filter*> filters;

 

3:然后顺次执行以下命令:

make config

make all

make install 

 

4.最终在bin目录下会生成可执行文件sclite

三、【使用】

仍然在sctk-2.4.0目录下,创建存放评估结果的目录:mkdir tmp

然后执行命令:./bin/sclite  -r label.test -h result.test  -i wsj -e gb -o all -O  tmp/ 

另一种方法是:./bin/sclite  -r label.test -h result.test  -i wsj -e gb -o dtl -O  tmp/  可以得到更详细的结果信息

其中label.test为人工标注过的正确文本内容,内容是按字切分的,result.test 为语音识别后的结果文件

 

四、【结果说明】

tmp/result.test.sys的最后几行中,包含”Sum/Avg”的那行是整体的评估详情,例如:

Sum/Avg|   11    645 | 92.7    3.3    4.0    1.1    8.4  100.0

 

表示本次测试共11句话,645个词,92.7%的字正确率,3.3%的替代错误率,4.0%的删除错误率,1.1%的插入错误率,整体句错误率为100%

 

tmp/result.test.pra里面有每句话的对齐详情,具体展示了是哪些替代错误(S)、删除错误(D)和插入错误(I)

 

label.test中的文本举例:你 吃 饭 了 吗(731279974666705361.wav)

result.test中的文本举例:你 吃 饭 啦 吗(731279974666705361.wav)

评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值