#执行该命令后,/usr/mengqc/mub1代表的路径将存放在名为/usr/liu/abc的文件中。
ln -s /usr/mengqc/mub1 /usr/liu/abc
#kaldi转换对齐文件
show-alignments phones.txt final.mdl ark:all_ali >all_phn.txt
cat src/base/version.h #查看kaldi版本
#因为前几层抽象的,不同语言都有些发音共性的,
#前几层抽象层,拿出来可以共享特性的
#一般是要对方的数据比你拥有的数据的规模大很多,拿过来做迁移才比较有意义
#注意特征要保持一致
#解压
gzip -d ali.*
#按照大小写排序
export LC_ALL=C
sort py.txt >py1.txt
uniq py1.txt >py2.txt
#查找进程
ps aux|grep luzeru
#查文件夹内存
du -sh
#查询个人磁盘空间大小
quota -s
#打包排除某个文件夹
tar -zcvf abc.tar.gz --exclude=abc4 abc
#远程登录
ssh cpu3.speech.b2b
root thsb2b12ab34cd
命令如下,其中1.txt中包含大写字母源文件,2.txt是新生成的文件里面只有小写字母
tr "[:upper:]" "[:lower:]" < 1.txt > 2.txt
tr "[:lower:]" "[:upper:]" < 123.text > 123up.txt
awk '{$1="";print $0}' text #删除文件 text中第一列 方式一
sed -e 's/[^ ]* //' text #方式二
1.awk 'NR%2==0' file
2.sed -n '1,$n;p' file
3.sed -n '1,$p;n' file
4.奇数行:sed '2~2d' file
5.偶数行:sed '1~2d' file
#麻烦解释下命令的一些参数的意思。
#NR读入的行数, NR%2==0 行数能整除2就表示是偶数行了
#2和3、其实不用要那个1,$的,直接 sed -n 'n;p' file就可以
#n;p 当读第一行时,n就读入第二行把第一行覆盖了,然后输出
#接着读第三行,n就读入第四行把第二行覆盖了,然后输出
#p;n 原理和n;p一样
#4、2~2d 后面那个2表示输入流为两行两行的,前面那个2和后面那个d表示把第二行删了
#5、1~2d 一样后面那个2表示输入流为两行的,前面那个1和后面那个d表示把第二行删了
file filename.txt #查看文件编码类型
cut -c17- 1204.txt>1204text.txt #列剪贴 按照字符剪贴 重17列到最后
cut -c1-17 1204.txt #剪切1到17列
sed -i "s/'[0-9]#.*/ /g" ./* #把full标签全标签 替换成只剩五因素
sed -n '1p' test.txt #查看文件第一行
sed -n "10,15p" ./hmms/hmm3/sil #查看10 到 15行内容
sed -i 's/\"6/\"*\/6/g' ./mlf/word.mlf #把 "6 替换成 "*/6
sed -n '3,9p' head.tx #查看 3到9行
sed -n '/ruby/p' ab #查询包括关键字ruby所在所有行
sed -i "s/DH-1/DH/g" ./* #将当前目录下的所有文件中的字符"DH-1"替换成"DH"
sed -n 'p;n' file #打印 奇数
sed -n 'n;p' file #偶数
sed -i '/^sil$/d' zmword.mlf #用sed删除指定行 例子删除 sil行
sed -i -e '/@_uk_@/d' jinrong.txt #删除包含字符@_uk_@ 的行
sed -i -e '/'000046'/d' utt.txt #删除包含字符string的行
sed 's/ //g' datafile > datafile1 # 删除空格
awk "NR%2==0" file #打印偶数行
tar -xf HTS-demo_NIT-ATR503-M001.tar.bz2 #解压压缩包
tar -xvzf LabelParser.tar.gz
tar -cf HTS-demo_CHN-THS-F99.bar ./HTS-demo_CHN-THS-F99 #打包
grep -f error.namelist 784_yunlv.txt >error.textlist 在784文本中查找包含error文本中的内容的行
grep -v -f error.namelist 784_yunlv.txt >ringt.textlist 由上取反
pip install tgt #如果缺少python包 如 “No module named tgt” 则执行安装这个模块
unix2dos
dos2unix #转换格式
paste #合并列 按列合并两个文件
colrm #删除文件中的指定列
grep "K\*" ./* #查找当前目录下包含字符“K*”的文件
sed -i 's/\"6/\"*\/6/g' ./word.mlf #完美搭档 查找完 替换
ls -l |grep "^-"|wc -l #统计当前文件夹下文件的个数
cat female2.txt | awk '{printf("TTS_CM_F1%05d\t%s\n", NR,$0)}' > female22.txt #给文件开头加上名字TTS_CM_F1
ls -l| awk '{print $1}'
#显示ls-l 打印出的第一列
#awk工作流程是这样的:读入有'\n'换行符分割的一条记录,
#然后将记录按指定的域分隔符划分域,填充域
#,$0则表示所有域,$1表示第一个域,$n表示第n个域。默认域分隔符是"空白键" 或 "[tab]键"
cat /etc/passwd |awk -F ':' '{print $1}'
#-F指定域分隔符为':'。
ls -l| awk '{print $3"\t"$4}'
#显示ls-l 打印出的第3域和第四域
mv A B #将目录A重命名为B
mv /a /b/c #将/a目录移动到/b下,并重命名为c
kill -9 1922 强制结束进程
rename F00C 863_F00_F00C * #重命名所有文件名 将F00C替换成863_F00_F00C *代表所有的文件
find / -name pinyin2phone.hu.83set.match.tbl 查找文件
g2p.bash -p ./text.txt >./pinyin.txt
hts_engine -m voices/qst001/ver1/Chinese_SMO.htsvoice -ow ./wav/THS_M01_4890.wav ./lab/THS_M01_4890.lab
hts_engine -m Chinese_SMO.htsvoice -ow ./71new.wav ./71.lab
查看决策树
./infodot.pl tree-dur.inf a
dot -Tpng -oaaa.png dur.dot
Python实战之os.walk(...)
import os
for root, dirs, files in os.walk('/opt/'):
print root #当前遍历到的目录的根 root 表示路径
print dirs #当前遍历到的目录的根下的所有目录 dirs 表示 路径下的子文件夹
print files #当前遍历到的目录的根下的所有文件 files 表示 路径下的子文件
1、读取文件的三个方法:read()、readline()、readlines()
2、三个方法均可接受一个变量用以限制每次读取的数据量,通常不使用该变量。
关于read()方法:
1、读取整个文件,将文件内容放到一个字符串变量中
2、如果文件大于可用内存,不可能使用这种处理
关于readline()方法:
1、readline()每次读取一行,比readlines()慢得多
2、readline()返回的是一个字符串对象,保存当前行的内容
关于readlines()方法:
1、一次性读取整个文件。
2、自动将文件内容分析成一个行的列表。
读取某一行
import linecache
count = linecache.getline("./pos/"+name_file[0]+".pos",1)
# python 中 常用的函数
files= os.listdir(path) #获取目录path下所有的文件
strip() # 头尾去空格
split() #切分
#按照行读取
import linecache
line2 = linecache.getline('pinyin.txt',j)
转换wave格式
#!/bin/bash
for file in *.wav; do
wav2raw $file
done
转换wav格式
#!/bin/bash
for file in *.wav; do
#sox *.wav -r 16000 -b 16 *.wav
#echo $file
c=${file}
echo $c
#c= $file
sox $file -r 16000 -b 16 -c 1 ./new/$c
done
soxi 10001.wav # 查看wav文件的信息,采样率 声道 等
soxi *.wav>inform #查看时长
编辑器 vim:
命令: G 跳转到最后一行
: gg跳转到第一行
在编辑模式下输入
ngg 或者 nG
n为指定的行数(如25)
25gg或者25G 跳转到第25行.
在命令模式下输入行号n
: n
HTS API: 配置文件
./configure --with-sptk-search-path=/mnt/Tools/SPTK-3.10/bin \
--with-hts-search-path=/mnt/Tools/htk/bin \
--with-hts-engine-search-path=/mnt/Tools/hts_engine_API-1.10/bin
./configure --with-sptk-search-path=/data/Softwares/SPTK-3.9/bin \
--with-hts-search-path=/usr/local/htk/bin \
--with-hts-engine-search-path=/data/Softwares/hts_engine_API-1.10/bin
简单的调用方法
% cd HTS-demo_CMU-ARCTIC-SLT
% ./configure --with-fest-search-path=/data/Softwares/festival/examples \
--with-sptk-search-path=/data/Softwares/SPTK-3.9/bin \
--with-hts-search-path=/usr/local/htk/bin \
--with-hts-engine-search-path=/data/Softwares/hts_engine_API-1.10/bin
% make
./configure --with-sptk-search-path=/data/Softwares/SPTK-3.9/bin \
--with-hts-search-path=/usr/local/htk/bin \
--with-hts-engine-search-path=/data/Softwares/hts_engine_API-1.10/bin \
MGCORDER=12\
GAMMA=1\
FREQWARP=0.0\
LNGAIN=1 \
USESTRAIGHT=1
It was created by HTS-demo_CHN_THS_F99 configure 2.3, which was
generated by GNU Autoconf 2.69. Invocation command line was
$ ./configure --with-sptk-search-path=/mnt/Tools/SPTK/bin
--with-hts-search-path=/mnt/Tools/hts/bin
--with-hts-engine-search-path=/mnt/Tools/hts_engine_API-1.10/bin
--with-world-search-path=/mnt/Tools/WORLD_v2/build VER=30 QNUM=001
./configure --with-sptk-search-path=/data/Softwares/SPTK-3.9/bin \
--with-hts-search-path=/usr/local/htk/bin \
--with-hts-engine-search-path=/data/Softwares/hts_engine_API-1.10/bin \
--with-world-search-path=/home/luzeru/HTS_merlin/tools/WORLD_v2/build VER=30 QNUM=001
我的秘密武器—linux
最新推荐文章于 2021-03-25 16:42:26 发布