先来一条awk :
awk '{print "'\''"""$0"""'\''" > "vocab.enzh-en.32000_test"}' vocab.enzh-en.32000_test
乍一看,还以为乱写的。其实这里面包括三个内容:
- awk中单引号表示 先用双引号中的单引号包裹,然后在里面转义表示 例如:"'\''"
- 字符连接,a""b 表示 ab, a''123''b 表示 a123b
- 修改源文件内容,awk '{print $0 > "s_name"}' s_name
分割文件:
awk -F '\t' '{print $3 >> "ai2018.en";print $4 >> "ai2018.ch"}' ai_challenger_MTEnglishtoChinese_trainingset_20180827.txt
-F 指定分隔符,中间语句用分号隔开 ,>> 重定向 追加到文件