wc命令
wc指令可以计算文件的Byte数、字数或者是列数
语法
wc [-clw] [file]
- -c : 显示Bytes数
- -l :显示行数
- -m : 统计字符数,不能与-c一起使用
- -w : 显示字数,一个字被定义为由空白、跳格或换行字符分隔的字符串。
- -L : 打印最长行的长度
详细:戳!
sort命令
sort的工作原理
sort 将文件的每一行作为一个单位,相互比较,比较原则是从首字符向后,依次按照ASCII值进行比较,最后将他们按升序输出
sort -u
: 去除重复行sort -r
: sort默认排序是升序,-r参数改为降序sort -n
: 以数值来排序sort -t
: 设置间隔符sort -k
: 指定第k列来排序sort -f
: 忽略大小写
详细:戳!
uniq 命令
uniq原理
uniq是对文本进行去重的命令
- 以行为单位,进行行与行之间的字符串比较进行去重
- 只能对有序的文本进行有效去重,所以常与sort结合使用
uniq参数
- -c:统计行出现的次数
- -d: 只显示重复的行并去重
- -u: 只显示唯一的行
- -i : 忽略字母大小写
- -f : 忽略前n个字段(字段间用空白字符分隔)
cut命令
cut原理
cut作用是从文件中的每一行中截取出一部分,可以从字符串中以字节、字符、字段等单位截取出一部分
cut参数
- -d: 分隔符,按照指定分隔符分隔列,与-f一起使用
- -f : 表示取出第几列
- -c : 以字符为单位取出固定字符区间(对汉字切割使用)
- -d : 以字节为单位进行分隔
例子
- 切割cut.txt 第一列:
cut -d ' ' -f 1 cut.txt
- 切割cut.txt 第二、三列:
cut -d ' ' -f 2,3 cut.txt
- 切割cut.txt的第5-8个字符:
cut -c 5-8 cut.txt
- 切割cut.txt的第2,4,6个字符:
cut -b 2,4,6 cut.txt
- 切割cut.txt的第6个字节以前的内容:
cut -b -6 cut.txt
待更…