cut sort uniq wc 一 文本处理工具

cut

cut是一个选取命令,就是将一段数据经过分析,取出我们想要的。
一般来说,选取信息通常是针对“行”来进行分析的,并不是整篇信息分析的。


-c :
    以字符为单位进行分割。

    cut -c1-3 test.txt:打印第1个到第3个字符
    cut -c5- test.txt:打印从第5个字符开始到结尾

-d :
    自定义分隔符,默认为制表符。

    cut -d';' -f 1

-f :
    用-d将文本分隔成一段一段后,-f用来取出第几段

    cut -f1 test.txt:取出一行分割后的第一个

    cut -f2,3 test.txt:取出一行分割后的第2到3个

sort

sort将文件的每一行作为一个单位,相互比较。
比较原则是从首字符向后,依次按ASCII码值进行比较,最后将他们按升序输出。

-u : 
    它的作用很简单,就是在输出行中去除重复行。

-r : 
    sort默认的排序方式是升序,如果想改成降序,就加个-r就搞定了。

-n : 
    以数值来进行排序。

-f : 
    忽略大小写


cat ld | sort -n

uniq

uniq命令可以在排序后处理重复的行。

常用选项:

-i
    忽略大小写

-c
    在行的开头输出该行出现的次数

-d
    只输出重复的行

-u
    只输出出现过一次的行


sort -n ld | uniq -c

wc

wc统计文件里面有多少单词,多少行,多少字符。

-l
    仅列出行;

-w
    仅列出多少字(英文单字);

-m
    多少字符;

转载于:https://www.cnblogs.com/loveer/p/11621718.html

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值