kaldi sre16/v1中local/make_sre.sh

#!/bin/bash
# Copyright 2017   David Snyder
# Apache 2.0.
#
# See README.txt for more info on data required.

set -e
# 你写的每个脚本都应该在文件开头加上set -e,
# 这句语句告诉bash如果任何语句的执行结果不是true则应该退出。
# 这样的好处是防止错误像滚雪球般变大导致一个致命的错误,
# 而这些错误本应该在之前就被处理掉。如果要增加可读性,
# 可以使用set -o errexit,它的作用与set -e相同

data_root=$1
data_dir=$2

wget -P data/local/ http://www.openslr.org/resources/15/speaker_list.tgz   
# 下载
tar -C data/local/ -xvf data/local/speaker_list.tgz   
#  解压
sre_ref=data/local/speaker_list   
# 把一个文件夹的路径赋值给sre_ref

# 查看speaker_list 的第一行,是下面的样子:(共计36614行)
# 100304 f sre2006 obtz B
# 含义是:speaker, gender, other_sre_year, utt_id, channel

local/make_sre.pl $data_root/LDC2006S44/ \
   04 $sre_ref $data_dir/sre2004
   
   # make_sre.pl 这个文件做了什么呢?主要还是转换声音格式
   # 参考local/make_mx6_mic.pl,local/make_mx6_calls.pl
   # Usage: make_sre.pl <path-to-data> <name-of-source> <sre-ref> <output-dir>
   # name-of-source实际指的是sre_year
   # 最后调用utils/utt2spk_to_spk2utt.pl,utils/fix_data_dir.sh

local/make_sre.pl $data_root/LDC2011S01 \
  05 $sre_ref $data_dir/sre2005_train

local/make_sre.pl $data_root/LDC2011S04 \
  05 $sre_ref $data_dir/sre2005_test

local/make_sre.pl $data_root/LDC2011S09 \
  06 $sre_ref $data_dir/sre2006_train

local/make_sre.pl $data_root/LDC2011S10 \
  06 $sre_ref $data_dir/sre2006_test_1

local/make_sre.pl $data_root/LDC2012S01 \
  06 $sre_ref $data_dir/sre2006_test_2

rm data/local/speaker_list.*    
# 删除

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值