shell常用工具

年少7

已于 2022-07-07 10:09:19 修改

阅读量2.3k

点赞数

分类专栏： shell脚本文章标签： linux 运维服务器

于 2021-06-14 17:11:04 首次发布

本文链接：https://blog.csdn.net/weixin_56477161/article/details/117789350

版权

shell脚本专栏收录该内容

13 篇文章 0 订阅

订阅专栏

文章目录

一 sort
二 unig工具
- - - 2.1 命令格式
    - 2.2 常用选项
三 tr
四 cut

一 sort

依据不同的数据类型进行排序

**字符排序
数字排序**

1.1 语法格式

sort  +选项参数

1.2 常用选项

选项	描述e
-f	忽略大小写
-b	忽略每行前面的空格
-M	按照月份进行排序
-n	按照数字进行排序
-r	反向排序
-u	等同于uniq,表示相同的数据仅显示一行
-t	指定分隔符,默认使用Tab按键分割
-o	<输出文件>将排序后的结果转存至指定文件
-k	指定排序区域

1.3 工具用法实例

按照用户的uid进行升序排列

sort -n -t: -k3 passwd

按照用户的uid进行降序排列

sort -nr -t: -k3 passwd

按照数字排序

sort -n passwd

按照数字排序并且去重

sort -nu passwd
sort -nr passwd 
sort -nru passwd

按照数字排序并将结果重定向到文件

sort -n passwd -o 1.txt 
sort -R passwd 
sort -u passwd

二 unig工具

去重排序 对连续排序使用
用于报告或者忽略文件中的重复行
一般与sort命令结合使用

2.1 命令格式

uniq 选项参数

2.2 常用选项

选项	说明
-c	统计出现的次数（count）
-d	只显示被计算为重复的行
-D	显示所有被计算为重复的行
-u	显示唯一值，即没有重复值的行
-i	忽略大小写
-z	在末尾使用\0，而不是换行符
-f	跳过多少个字段(field)开始比较重复值
-s	跳过多少个字符开始比较重复值
-w	比较重复值时每行比较的最大长度。即对每行多长的字符进行比较

示例

 sort uniq.txt | uniq //排序后去重
 sort uniq.txt | uniq  -d -c// 使用-d -c统计重复行出现的次数。

sort uniq.txt | uniq -D -c
-c不能和-D一起使用。结果说显示所有重复行再统计重复次数是毫无意义的行为。

三 tr

tr主要用于将从标准输入读取的数据进行结果集映射、字符压缩和字符删除。
它首先会将读取的标准输入进行排序然后按照某种方式换行，然后再根据给出的命令行参数做相关处理。

3.1 命令格式

 tr [options] [SET1] [SET2 ]

3.2 选项

选项	说明
-c	使用SET1的补集
-d	删除字符
-s	压缩字符
-t	截断SET1，使得SET1的长度和SET2的长度相同

3.3 tr映射

如果同时指定了SET1和SET2，则是将SET1的符号按位置一一对应映射为SET2中的符号。换句话说，就是对应替换。
tr接收到stdin后首先会把将结果按照某种标记符号进行换行。
之所以说tr是映射而不是替换，是因为两个结果集替换的时候符号位置是一一对应的。如果SET1比SET2短，则SET2多余的部分会被忽略，如果SET1比SET2长，POSIX认为这是不合理的，但也能执行，只不过结果有些意料之外，见下文。例如下面的例子，因为SET1中只有一个符号"\n"，于是替换时SET2中的Y被忽略。

[root@localhost ~]# ls | tr "\n" "XY" 
anaconda-ks.cfgXf1.txXf1.txtXinitial-setup-ks.cfgX[root]

这样就可以实现简单的加密和解密

[root@localhost ~]# echo "12345" | tr "0-9" "9876543210"
87654
[root@localhost ~]# echo "87654" | tr "0-9" "9876543210"
12345

前面的过程是将管道左边的12345对应到0-9的展开式0123456789，并将对应位映射到SET2的数字上。解密也是同理。

3.4 完全对应的替换

cat x.txt | tr -s " "//使用tr压缩空格使其变的规则

cat x.txt | tr -s " " "-" //如果指定SET2，假如替换为"-"
tr -d   ///是删除指定的符号
tr -c SET1 S  //ET2是将标准输入按照SET1求补集

[root@xuexi tmp]# echo "one ONE 1 two TWO 2 three THREE 3" | tr -d -c "[:upper:] \n" ONE TWO THREE 
[root@xuexi tmp]# echo "one ONE 1 two TWO 2 three THREE 3" | tr -d -c "[:alpha:] \n" one ONE two TWO
 three THREE [root@xuexi tmp]# echo "one ONE 1 two TWO 2 three THREE 3" | tr -d -c "[:digit:] \n" 
 1 2 3

四 cut

cut是一个选取命令，就是将一段数据经过分析，取出我们想要的。一般来说，选取信息通常是针对“行”来进行分析的，并不是整篇信息分析的。

4.1 其语法格式为

cut  [-bn] [file] 或 cut [-c] [file]  或  cut [-df] [file]

4.2 主要选项

选项	说明
-b	以字节为单位进行分割。这些字节位置将忽略多字节字符边界，除非也指定了 -n 标志
-c	以字符为单位进行分割
-d	自定义分隔符，默认为制表符
-f	与-d一起使用，指定显示哪个区域
-n	取消分割多字节字符。仅和 -b 标志一起使用。如果字符的最后一个字节落在由 -b 标志的 List 参数指示的范围之内，该字符将被写出；否则，该字符将被排除。

4.3 cut一般以什么为依据呢?

也就是说，我怎么告诉cut我想定位到的剪切内容呢 ?
cut命令主要是接受三个定位方法：
第一:字节（bytes），用选项 -b
第二:字符（characters），用选项 -c
第三:域（fields），用选项 -f

4.4 以“字节”定位

举个例子吧，当你执行ps命令时，会输出类似如下的内容：

[root@localhost ~]# who
liangxufei :0           2021-05-27 16:47 (:0)
liangxufei pts/0        2021-05-27 16:48 (:0)
liangxufei pts/1        2021-06-11 10:55 (:0)
root     pts/3        2021-06-14 16:12 (192.168.132.1)

如果我们想提取每一行的第3个字节，就这样：

[root@localhost ~]# who|cut -b 3
a
a
a
o

4.5 如果“字节”定位中，我想提取第3，第4、第5和第8个字节，怎么办?

-b支持形如3-5的写法，而且多个定位之间用逗号隔开就成了.
示例

[root@localhost ~]# who|cut -b 3-5,8
angf
angf
angf
ot

但有一点要注意，cut命令如果使用了-b选项，那么执行此命令时，cut会先把-b后面所有的定位进行从小到大排序，然后再提取。

[root@localhost ~]# who|cut -b 8,3-5
angf
angf
angf
ot

年少7

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
shell常用工具

提示：文章写完后，目录可以自动生成，如何生成可参考右边的帮助文档文章目录前言一、sort工具1.1语法格式1.2常用选项1.3工具用法实例二、unig工具2.1命令格式2.2常用选项1.引入库2.读入数据总结前言提示：这里可以添加本文要记录的大概内容：例如：随着人工智能的不断发展，机器学习这门技术也越来越重要，很多人都开启了学习机器学习，本文就介绍了机器学习的基础内容。提示：以下是本篇文章正文内容，下面案例可供参考一、sort工具依据不同的数据类型进行排序字符排序数字排序1.1语法
复制链接

扫一扫