Ok,everybody,今天我们来看Linux文件处理工具
这里主要介绍cut,sort,uniq,wc 的主要应用
1、数据剪切cut
命令语法:
cut OPTION… [FILE]…
由选项可以看出cut剪切文件依据三种方法:
1、字节
2、字符
3、区域
命令选项:
- -b :以字节为单位进行分割
- -c :以字符为单位进行分割
- -d :自定义分隔符,默认为制表符
- -f :与-d一起使用,指定显示哪个区域(域)
- -n :取消分割多字节字符。仅和 -b 标志一起使用。如果字符的最后一个字节落在由 -b 标志的 List 参 数指示的
范围之内,该字符将被写出;否则,该字符将被排除
来看一个例子:
2、sort排序
用于字段排序
命令语法:
sort [OPTION]… [FILE]…
sort [OPTION]… --files0-from=F
命令选项:
- -f:忽略大小写
- -b:忽略最前面的空白字符
- -M:以月份名字排序
- -n:以纯数字排序
- -u:相邻数据去重
- -r:反向排序
- -t:指定排序分隔符
- -k:执行区间
- -o filename:将结果保存在filename中
3、 uniq 去重
uniq命令可以去除排序过的文件中的重复行,因此uniq经常和sort合用。也就是说,为了使uniq起作
用,所有的重复行必须是相邻的
命令语法:
uniq [OPTION]… [INPUT [OUTPUT]]
命令选项:
-c:标注出现的次数
-d:只输出重复的行
-D:显示所有重复行
-f:跳过前N列 列是通过空白分割
-i:忽略大小写
-s N:跳过前N个字符
-u:只显示唯一的行
-w N:每行的第N个字符之后不做对照
-z:使用’\0’作为行结束符,而不是新换行
4、 wc 统计
linux系统中的wc(Word Count)命令的功能为统计指定文件中的字节数、字数、行数,并将统计结果显
示输出
命令语法:
wc [OPTION]… [FILE]…
命令选项:
- -c 统计字节数
- -l 统计行数
- -m 统计字符数。这个标志不能与 -c 标志一起使用
- -w 统计字数。一个字被定义为由空白、跳格或换行字符分隔的字符串
- -L 打印最长行的长度
oh,字符数好像不太对劲,这是因为在 Hi!sherlock 后面多打了一个空格