cut & sort & uniq 工具合集

cut

cut工具主要用于在文件中剪切数据,它的处理机制与sed、awk是一样的,都是以行为处理单位。
cut命令主要接受三个定位方法:-b , -c , -f

  • 字节(bytes):-b
    这里写图片描述
  • 字符(characters):-c
    这里写图片描述
  • 域(fields):-f
    -d指明了域分隔符,-f指明要剪切哪几个域,这个用法与awk类似
    这里写图片描述

(截取字符串的方法:http://blog.csdn.net/qq_33951180/article/details/68059098

sort

sort是常用的排序工具,将每一行作为一个单位进行比较,比较原则是从首字符向后,依次按照ASCII码值进行比较,最后将它们按照升序输出。
sort常用的有如下选项:

  • -u:在输出行中去除重复行
    这里写图片描述

  • -r:逆序
    sort排序结果默认是升序的,用这个选项可以将sort排序结果改为降序
    这里写图片描述

  • -o:将排序好的内容写回原文件
    由于sort默认是把结果输出到标准输出,所以需要用重定向才能将结果写入文件,形如sort filename > newfile。但是,如果你想把排序结果输出到原文件中,用重定向可就不行了。
    这里写图片描述

  • -n:以数值进行排序
    假设文件中有1,10,100,想按照数值大小进行排序的话就需要用到这个选项
    这里写图片描述

  • -k和-t:指定间隔符的指定列进行排序
    -t指明了域分隔符,-k指明要根据第几列进行排序。例如:file文件中有三列,第一列是产品名称,第二列是数量,第三列是价格,现在需要根据第三列进行排序
    这里写图片描述

  • -f:忽略大小写进行排序(会将小写字母转换为大写字母进行排序)
    这里写图片描述

  • sort的其他常用选项
    -b:忽略每一行前面的所有空白部分,从第一个可见字符开始比较。
    -c:检查文件是否已排好序,如果乱序,则输出第一个乱序的行的相关信息,最后返回1。
    -C:检查文件是否已排好序,如果乱序,不输出内容,仅返回1。
    -M:以月份来排序,比如JAN小于FEB等等。

uniq

uniq的作用是过滤重复部分、显示文件内容。这个命令读取输入文件,并比较相邻的行。正常情况下,第二个及以后更多个重复行将被删去,行比较是根据所用字符集的排序序列进行的。该命令加工后的结果写到输出文件中。输入文件和输出文件必须不同。如果输入文件用“- ”表示,则从标准输入读取。
该命令常用选项如下:

  • -d:只显示重复行
    这里写图片描述

  • -u:只显示文件中不重复的行
    这里写图片描述

  • -c:显示输出中
    在每行行首加上文本行在文件中出现的次数。可以取代-u和-d选项
    这里写图片描述

  • 1
    点赞
  • 6
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值