关于最后再处理thchs30的标签,最后python输出的是科学计数表示,并不能作为我们神经网络的标签,为此我们需要将科学计数转换成整数形式。刚开始提取的是科学计数表示,如下图所示:
采用 awk '{print int($1)}' file1 >> file2 , 把科学计数表示转换成整型,如下图所示:
由于本人最近在学python,于是便采用python语言写了一个脚本:如下所示(脚本中未被注释的部分):
my_list = [] filename = '/home/zhangwei/train_label.txt' new_filename = '/home/zhangwei/train_label_01.txt' with open(filename , 'r') as f: for x in f.readlines(): my_list.append(float(x.split()[0])) with open(new_filename , 'w') as fw: for i in my_list: fw.write(str(int(i))+'\n')