在Linux操作系统中对文件内容的一些简单操作(对文件内容进行去重处理,对文件中的数据按照ASCII码表进行排序处理。)

本文介绍了如何使用Unix/Linux命令uniq处理文件内容去重,以及sort命令进行排序,包括按列和降序排列。还展示了如何使用du命令查看并排序文件的磁盘空间大小。
摘要由CSDN通过智能技术生成

对目录中文件中的内容进行去重处理

uniq 文件名称

如上图所示,使用uniq命令后面加上文件的路径,就可以对文件中的内容进行去重处理。

所谓的去重处理并不会对文件中的内容进行修改,而是将去重处理之后的文件内容呈现给用户,但是文件中的内容并不会发生改变。

如上图所示,uniq命令用于对文件中的内容进行去重处理,但是只能去除相邻的重复内容,如果重复内容不相邻则无法去重。

对文件中的数据进行排序

sort [选项] 文件名称

sort -n -k 2 -t  ":" -r   /tmp/file05

-n按照阿拉伯数字进行排序

-k 2 按每行数据的第二列进行排序,默认使用空白字符分割每一行

-t 用于指定分隔符

-r 降序,默认是升序排列数据

如上图所示,sort命令可以将文件中的数据按照ASCII码表中的数值,进行排序。

当一组数据中的每个数据都是许多字符时,按照第一个字符所对应的ASCII码表值进行对比,如果第一个字符的数值大小能够比较出来两个数据谁大谁小,就不再比较这两个数据之后的字符。

可以在sort命令之后加上-n选项,这时,文件中数据的排序就是我们日常生活的阿拉伯数字排序。

其中-k  2的意思是对文件的第二部分排序。

其中-k 3的意思是按照文件数据的第三部分去排序。

其中-t ":"选项的作用是告诉sort命令在划分每一行内容时,按照:划分每一行内容,进而将每一行内容分成若干份。

如上图所示,当不加-r  选项的时候,排列文件中的数据按照升序排列,当加上-r选项的时候,排列文件中的数据按照降序排列。

这里的r表示reverse(反向的)

如上图所示,当文件中的重复数据不相邻时,可以使用sort 命令将文件中的数据进行排序,将重复的文件数据,集中在一起,这是再使用uniq命令去将文件中的数据进行去重操作,就会得到已经排好序并且没有重复数据的文件内容了!!!!!

直接显示文件所占磁盘空间大小可以使用du -ah /etc/

每一个文件一行,每一行有两列,第一列是文件大小,第二列是文件的绝对路径。

du -a这时,在显示文件大小的时候,前面就是纯数字,没有单位。

du -ah显示文件大小,并且显示文件大小的单位,sort -n -k 1 -r 按照文件数据的第一列,通过比较阿拉伯数字的大小的前提下,进行降序排列。

  • 3
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值