#!/bin/bash
# Copyright 2017 David Snyder
# Apache 2.0.
#
# See README.txt for more info on data required.
set -e
# 你写的每个脚本都应该在文件开头加上set -e,
# 这句语句告诉bash如果任何语句的执行结果不是true则应该退出。
# 这样的好处是防止错误像滚雪球般变大导致一个致命的错误,
# 而这些错误本应该在之前就被处理掉。如果要增加可读性,
# 可以使用set -o errexit,它的作用与set -e相同
data_root=$1
data_dir=$2
wget -P data/local/ http://www.openslr.org/resources/15/speaker_list.tgz
# 下载
tar -C data/local/ -xvf data/local/speaker_list.tgz
# 解压
sre_ref=data/local/speaker_list
# 把一个文件夹的路径赋值给sre_ref
# 查看speaker_list 的第一行,是下面的样子:(共计36614行)
# 100304 f sre2006 obtz B
# 含义是:speaker, gender, other_sre_year, utt_id, channel
local/make_sre.pl $data_root/LDC2006S44/ \
04 $sre_ref $data_dir/sre2004
# make_sre.pl 这个文件做了什么呢?主要还是转换声音格式
# 参考local/make_mx6_mic.pl,local/make_mx6_calls.pl
# Usage: make_sre.pl <path-to-data> <name-of-source> <sre-ref> <output-dir>
# name-of-source实际指的是sre_year
# 最后调用utils/utt2spk_to_spk2utt.pl,utils/fix_data_dir.sh
local/make_sre.pl $data_root/LDC2011S01 \
05 $sre_ref $data_dir/sre2005_train
local/make_sre.pl $data_root/LDC2011S04 \
05 $sre_ref $data_dir/sre2005_test
local/make_sre.pl $data_root/LDC2011S09 \
06 $sre_ref $data_dir/sre2006_train
local/make_sre.pl $data_root/LDC2011S10 \
06 $sre_ref $data_dir/sre2006_test_1
local/make_sre.pl $data_root/LDC2012S01 \
06 $sre_ref $data_dir/sre2006_test_2
rm data/local/speaker_list.*
# 删除
kaldi sre16/v1中local/make_sre.sh
最新推荐文章于 2020-06-18 10:33:10 发布