linux 文本处理二

最新推荐文章于 2024-08-12 23:30:00 发布

td901105td

最新推荐文章于 2024-08-12 23:30:00 发布

阅读量279

点赞数

分类专栏： Linux 文章标签： linux

本文链接：https://blog.csdn.net/td901105td/article/details/44889385

版权

14 篇文章 0 订阅

订阅专栏

uniq

uniq是用来从排序好的结果中删除重复的行，一般与sort结合使用。sort命令可以使用-u选项代替uniq。

uniq必须是处理已经排序过的数据，否则不会产生任何影响，如下所示：

下面是uniq命令的常用选项：

cut

cut命令是用来从一行中抽取文本（抽取列），可以接受多个文件为参数或处理标准输出。

参数	描述
-c char_list	从文本中抽出由char_list定义的文本，char_list可能由一个或者多个逗号分隔的数值区间组成。例如：cut -c 7-10取出每行的第7到第十个字符
-f field_list	从文本中抽取一个或多个由field_list定义的字段，字段之间可以由逗号分隔
-d deli_char	在使用-f选项时要使用分隔符来区分字段，默认的分隔符是制表符，可以使用-d来手动指定分隔符。

由于cut抽取文本不灵活，所以cut 命令最好用来从其它程序产生的格式化文件中抽取文本，而不是从人们直接输入的文本中抽取。

因为我们的 /etc/passwd文件是由冒号分隔开的，最好用 cut 来抽取字段而不是字符。这是因为每行不太可能包含相同的字符数，这就使计算每行中字符的位置变得困难或者是不可能。

关注

专栏目录