有几种工具用来处理文本文件分类,合并和分割操作。
sort
sort命令将许多不同的域按不同的列顺序分类。当查阅注册文件或为另一用户对下载文件重排文本列时,sort工具很方便。sort选项很长,甚至有时在各种不同开关的实际功能和结果进行比较时也会遇到麻烦,原因可能是在结合使用sort的不同选项时有些概念模糊不清。
sort –cmu –o output_file [other options]+pos1 +pos2 input_files
-c :测试文件是否已经分类
-m :合并两个分类文件
-u :删除所有复制行
-o :存储sort结果的输出文件名
其他选项
-b :使用域进行分类时,忽略第一个空格
-n :指定分类时域上的数字分类
-t :域分隔符,用非空格或tab键分隔域
-r :对分类次序或比较求逆
+n :n为域号,使用此域号开始分类
n :n为域号,在分类比较时忽略此域,一般与+n一起使用
post1 :传递到m,n。m为域号,n为开始分类字符数,例如4,6即以第5域分类,从第7个字符开始
除了-o可以保存分类结果,也可以使用重定向方法保存:
sort video.txt > results.out
sort认为一个空格或一系列空格为分隔符。要加入其他方式分隔,使用-t选项。
sort 参照第一个域作为域0: