（四）kaldi thchs30数据准备

Felix Mark

于 2023-01-04 18:55:26 发布

阅读量615

点赞数

分类专栏： kaldi 文章标签：语音识别

本文链接：https://blog.csdn.net/weixin_53694631/article/details/128552814

版权

kaldi 专栏收录该内容

13 篇文章

订阅专栏

下载地址

THCHS30语音数据集

data_thchs30.tgz [6.4G] ( 语音数据和语录 )
test-noise.tgz [1.9G] ( 标准0db噪声测试数据 )
resource.tgz [24M] ( 补充资源，包括训练数据的词库、噪声样本 )

上传数据

用一切可能的方式上传数据到远程服务器，比如Xtfp，或者sftp，这里使用sftp

只需要四条命令

sftp登录
上传data_thchs30.gzip
上传test-noise.gzip
上传resource.gzip

sftp常用命令

#密码登录
sftp -P 22 zhangsan@192.168.0.100
#秘钥登录
sftp -P 22 -i ~/.ssh/id_rsa zhangsan@192.168.0.100

更改远程工作目录

cd /abc

更改和/或打印本地工作目录

lcd /abc

列出远程目录的内容

ls

列出本地目录的内容

lls

打印远程工作目录

pwd

打印本地工作目录

lpwd

explore

将文件从服务器下载到本地计算机

# 把sftp服务器上test.txt文件下载到本地
get /tmp/test.txt ~/
# 把sftp服务器上test文件下载到本地
get -r /tmp/test/ ~/

将文件从本地计算机上载到服务器

# 把本地文件test.txt上传到ftp服务器/tmp目录下
put ~/test.txt /tmp/
# 把本地文件test上传到sftp服务器/tmp目录下
put -r ~/test /tmp/

在远程服务器上创建一个目录abc

mkdir abc

移动或重命名远程服务器上的文件

mv /test.txt /abc.txt

移动或重命名远程服务器上的文件

rename /test.txt /abc.txt

删除远程服务器上的文件abc.txt

rm abc.txt

删除远程服务器上的目录abc

rmdir abc

帮助

help

清屏

clear

断开连接

bye、exit、quit、!

解压数据到指定路径

在/usr/local/kaldi/egs/thchs30/s5下创建一个文件夹thchs30-openslr

cd /usr/local/kaldi/egs/thchs30/s5
mkdir thchs30-openslr

将数据解压到thchs30-openslr

tar zxvf data_thchs30.gzip的路径  -C /usr/local/kaldi/egs/thchs30/s5/thchs30-openslr
tar zxvf resource.gzip的路径  -C /usr/local/kaldi/egs/thchs30/s5/thchs30-openslr
tar zxvf test-noise.gzip的路径  -C /usr/local/kaldi/egs/thchs30/s5/thchs30-openslr