linux三剑客

最新推荐文章于 2024-10-13 21:29:35 发布

zhanghao921

最新推荐文章于 2024-10-13 21:29:35 发布

阅读量55

点赞数

文章标签： linux python 运维

原文链接：https://www.cnblogs.com/poloyy/p/14248101.html

版权

linux三剑客

grep作用

在文件或标准输入中，通过正则表达式查找对应的内容

语法格式

grep [选项]... PATTERN [FILE]...

grep的常用选项参数

参数选项	描述
-G	默认值
-F	相当于使用fgrep，但必须用 -F
-E	相当于使用egrep，但必须用 -E
-V	打印 grep 的版本号

-E 的栗子

前提：当 grep 想同时过滤多个条件或操作

错误写法：

默认不支持多条件匹配

ps -ef | grep "java|tomcat"

正确写法:

ps -ef | grep -E "java|tomcat"

匹配控制选项参数

参数选项	描述
-e	PATTERN 来进行匹配操作
-f	从文件中取得 PATTERN
-i	忽略大小写
-v	反转匹配，选择没有被匹配到的内容
-w	匹配整词，精确地单词,单词的两边必须是非字符符号(即不能是字母数字或下划线)
-x	仅选择与整行完全匹配的匹配项
--line-buffered	有一个文件是动态的，它不断地添加信息到文件的尾部，而你想要输出包含某些信息的行。即持续的grep一个动态的流

-e 的栗子

当你有多个正则表达式想同时匹配时，可以用 -e，一个 -e 接一个正则表达式，它们是或的关系，不是与的关系.

-f 的栗子

-i 的栗子

-v 的栗子

-w 的栗子

-x 的栗子

一般输出控制选项

参数选项	描述
-s	禁止显示错误信息
-q	安静模式,不会有任何输出内容,查找到匹配内容会返回0,未查找到匹配内容就返回非0
-m num	匹配 num 次后停止
-c	匹配成功数量
-l	列出匹配成功结果的文件来源（标准输入或文件名称）
-H	给每一个匹配结果打印来源（标准输入、文件名）

-q 的栗子

目前未发现任何作用

-m 的栗子

-c 的栗子

-l 的栗子

ls 输出的内容就是标准输入

输出控制参数讲解

参数选项	描述
-b	输出的同时打印字节偏移
-n	输出的同时打印行号
-H	给每一个匹配结果打印来源（标准输入、文件名）
-h	输出是不显示来源（默认）
-o	只显示匹配 PATTERN 的部分

-b 的栗子

-n 的栗子

-H 的栗子

因为结果都来源于 ls 的标准输入，所以显示标准输入，如果是来源于某个文件则会显示文件名

-o 的栗子

文件和目录选项

参数选项	描述
-a	不忽略二进制的数据
-d	当要查找的是目录而非文件时，必须使用这项参数
-r	以递归方式读取每个目录下的所有文件; 这相当于-d recurse选项。

巨常用的语法：

重点

写的正则表达式最好用 ' ' 包起来，当碰到需要转义符的时候才会生效

查找指定进程

ps -ef | grep java

查找指定进程并统计数量

ps -ef | grep -c java

从文件中查找关键字

grep src test.txt

从文件中查找关键字并输出它的行号

grep -n src test.txt

从多个文件中查找关键字

grep src src.txt src1.txt src2.txt

从文件中查找关键字后，再从结果中找到指定关键字

cat src.txt | grep -v s | grep -w lib

找出文件中的空白行

grep -n ^$ test.txt

显示当前目录下面以 .txt 结尾的文件中的所有包含每个字符串至少有4个连续小写字符的字符串的行

grep -n "[a-z]\{4\}" *.txt

sed作用

sed是一个流编辑器，非交互式的编辑器，它一次处理一行内容。处理时，把当前处理的行存储在临时缓冲区中，称为“缓冲空间”(pattern space) 。接着用sed命令处理缓冲区中的内容，处理完成后，把缓冲区的内容送往屏幕。接着处理下一行，这样不断重复，直到文件末尾。

文件内容并没有改变，除非使用重定向存储输出。

sed用来自动编辑一个或多个文件，简化对文件的反复操作，编写转换程序等

sed语法

sed [选项] [sed指令] [输入文件]

选项参数:

p==显示在模式空间的内容

d:删除

=: 打印匹配行的行号

-n: 取消默认的完整输出，只要需要的

-e: 允许多项编辑

-i: 修改文件内容

-r: 支持拓展正则表达式（|、() ）

s///:查找替换，其分隔符可自行制定，常见的有s@@@，s###

命令参数：

a:在当前行后添加一行或多行

c:在当前行进行替换修改

d:在当前行进行删除操作

i:在当前行之前插入文本

p:打印匹配的行或指定行

n:读入下一输入行，从下一条命令进行处理

!:对所选行以外的所有行应用命令

h:把模式空间里的内容重定向到暂存缓冲区

H:把模式空间里的内容追加到暂存缓冲区

g:取出暂存缓冲区的内容，将其复制到模式空间，覆盖该处原有内容

G:取出暂存缓冲区的内容，将其复制到模式空间，追加该处原有内容

sed常用命令

创建测试文件

[root@yfy ~]# cat>person.txt<<EOF

> 101,zhangsan,CEO

> 102,lisi,CTO

> 103,Alex,COO

> 104,wangwu,CFO

> 105,zhaoliu,CIO

> EOF

（1）查询

只打印第一行

[root@yfy ~]# sed -n '1p' person.txt

101,zhangsan,CEO

查看第3到4行

[root@yfy ~]# sed -n '3,4p' person.txt

104,wangwu,CFO

105,zhaoliu,CIO

包含Alex的行

[root@yfy ~]# sed -n '/Alex/p' person.txt

103,Alex,COO

最后一行

[root@yfy ~]# sed -n '$p' person.txt

105,zhaoliu,CIO

已w开头,u结尾的行

[root@yfy ~]# sed -n '/w.*u/p' person.txt

104,wangwu,CFO

从包含101的行到包含104的行

[root@yfy ~]# sed -n '/101/,/104/p' person.txt

101,zhangsan,CEO

102,lisi,CTO

103,Alex,COO

104,wangwu,CFO

查询有wangwu或者lisi的行

如果只用-n是查不出来的，因为默认情况下，sed只支持基本正则表达式。

[root@yfy ~]# sed -rn '/lisi|wangwu/p' person.txt

102,lisi,CTO

104,wangwu,CFO

查询指定分行

[root@yfy ~]# sed -n '2p;4p' person.txt

102,lisi,CTO

104,wangwu,CFO

将符合制定内容的文本存入另一个文本中

[root@yfy ~]# sed -n '/^104/w hello.txt' person.txt

[root@yfy ~]# cat hello.txt

104,wangwu,CFO

通过正则取出绝对路径

[root@yfy ~]# echo "/var/log/messages" |sed 's#/.*/##'

messages

（2）新增

a ====== append 追加

i ====== insert 插入

在第二行后面加一个新行

[root@yfy ~]# sed '2a hello world' person.txt

101,zhangsan,CEO

102,lisi,CTO

hello world

103,Alex,COO

104,wangwu,CFO

105,zhaoliu,CIO

在第二行插入一行

[root@yfy ~]# sed '2i hello world' person.txt

101,zhangsan,CEO

hello world

102,lisi,CTO

103,Alex,COO

104,wangwu,CFO

105,zhaoliu,CIO

（3）删除

删除第一行

[root@yfy ~]# sed '1d' person.txt

102,lisi,CTO

103,Alex,COO

104,wangwu,CFO

105,zhaoliu,CIO

显示文件内容但是不包含Alex

方法一：

[root@yfy ~]# grep -v "Alex" person.txt

101,zhangsan,CEO

102,lisi,CTO

104,wangwu,CFO

105,zhaoliu,CIO

方法二：

[root@yfy ~]# sed '/Alex/d' person.txt

101,zhangsan,CEO

102,lisi,CTO

104,wangwu,CFO

105,zhaoliu,CIO

方法三：（没生效，应该写的不对，后期改正。。。）

[root@yfy ~]# awk '!/Alex/d' person.txt

101,zhangsan,CEO

102,lisi,CTO

103,Alex,COO

104,wangwu,CFO

105,zhaoliu,CIO

方法四：

[root@yfy ~]# sed -n '3!p' person.txt

101,zhangsan,CEO

102,lisi,CTO

104,wangwu,CFO

105,zhaoliu,CIO

删除配置文件中#开头的注释行

sed '/^#/d' my.conf

（4）修改

指定某行进行内容替换

[root@yfy ~]# sed -i '7c SELINUX=Disabled' /etc/selinux/config

正则匹配对应内容，然后进行替换

[root@yfy ~]# sed -i '/^SELINUX=/c SELINUX=Disabled' /etc/selinux/config

（5）替换

's/old/new/g'

's#old#new#g'

's@old@new@g'

s#old#new#：只会替换每一行的第一个内容

将所有数字替换成*

[root@yfy ~]# sed 's#[0-9]#*#g' person.txt

***,zhangsan,CEO

***,lisi,CTO

***,Alex,COO

***,wangwu,CFO

***,zhaoliu,CIO

3.练习

反向引用获取id

AWK作用

awk是行处理器: 相比较屏幕处理的优点，在处理庞大文件时不会出现内存溢出或是处理缓慢的问题，通常用来格式化文本信息

awk命令形式:

awk [-F|-f|-v] ‘BEGIN{} //{command1; command2} END{}’ file

[-F|-f|-v] 大参数，-F指定分隔符，-f调用脚本，-v定义变量 var=value

' ' 引用代码块

BEGIN 初始化代码块，在对每一行进行处理之前，初始化代码，主要是引用全局变量，设置FS分隔符

// 匹配代码块，可以是字符串或正则表达式

{} 命令代码块，包含一条或多条命令

；多条命令使用分号分隔

END 结尾代码块，在对每一行进行处理之后再执行的代码块，主要是进行最终计算或输出结尾摘要信息

特殊要点:

$0 表示整个当前行

$1 每行第一个字段

NF 字段数量变量

NR 每行的记录号，多文件记录递增

FNR 与NR类似，不过多文件记录不递增，每个文件都从1开始

\t 制表符

\n 换行符

FS BEGIN时定义分隔符

RS 输入的记录分隔符，默认为换行符(即文本是按一行一行输入)

~ 匹配，与==相比不是精确比较

!~ 不匹配，不精确比较

== 等于，必须全部相等，精确比较

!= 不等于，精确比较

&& 逻辑与

|| 逻辑或

+ 匹配时表示1个或1个以上

/[0-9][0-9]+/ 两个或两个以上数字

/[0-9][0-9]*/ 一个或一个以上数字

FILENAME 文件名

OFS 输出字段分隔符，默认也是空格，可以改为制表符等

ORS 输出的记录分隔符，默认为换行符,即处理结果也是一行一行输出到屏幕

-F'[:#/]' 定义三个分隔符

print & $0

print 是awk打印指定内容的主要命令

awk '{print}' /etc/passwd == awk '{print $0}' /etc/passwd

awk '{print " "}' /etc/passwd //不输出passwd的内容，而是输出相同个数的空行，进一步解释了awk是一行一行处理文本

awk '{print "a"}' /etc/passwd //输出相同个数的a行，一行只有一个a字母

awk -F":" '{print $1}' /etc/passwd

awk -F: '{print $1; print $2}' /etc/passwd //将每一行的前二个字段，分行输出，进一步理解一行一行处理文本

awk -F: '{print $1,$3,$6}' OFS="\t" /etc/passwd //输出字段1,3,6，以制表符作为分隔符

-f指定脚本文件

awk -f script.awk file

BEGIN{

FS=":"

}

{print $1} //效果与awk -F":" '{print $1}'相同,只是分隔符使用FS在代码自身中指定

awk 'BEGIN{X=0} /^$/{ X+=1 } END{print "I find",X,"blank lines."}' test

I find 4 blank lines.

ls -l|awk 'BEGIN{sum=0} !/^d/{sum+=$5} END{print "total size is",sum}' //计算文件大小

total size is 17487

-F指定分隔符

$1 指指定分隔符后，第一个字段，$3第三个字段， \t是制表符

一个或多个连续的空格或制表符看做一个定界符，即多个空格看做一个空格

awk -F":" '{print $1}' /etc/passwd

awk -F":" '{print $1 $3}' /etc/passwd //$1与$3相连输出，不分隔

awk -F":" '{print $1,$3}' /etc/passwd //多了一个逗号，$1与$3使用空格分隔

awk -F":" '{print $1 " " $3}' /etc/passwd //$1与$3之间手动添加空格分隔

awk -F":" '{print "Username:" $1 "\t\t Uid:" $3 }' /etc/passwd //自定义输出

awk -F: '{print NF}' /etc/passwd //显示每行有多少字段

awk -F: '{print $NF}' /etc/passwd //将每行第NF个字段的值打印出来

awk -F: 'NF==4 {print }' /etc/passwd //显示只有4个字段的行

awk -F: 'NF>2{print $0}' /etc/passwd //显示每行字段数量大于2的行

awk '{print NR,$0}' /etc/passwd //输出每行的行号

awk -F: '{print NR,NF,$NF,"\t",$0}' /etc/passwd //依次打印行号，字段数，最后字段值，制表符，每行内容

awk -F: 'NR==5{print}' /etc/passwd //显示第5行

awk -F: 'NR==5 || NR==6{print}' /etc/passwd //显示第5行和第6行

route -n|awk 'NR!=1{print}' //不显示第一行

//匹配代码块

//纯字符匹配 !//纯字符不匹配 ~//字段值匹配 !~//字段值不匹配 ~/a1|a2/字段值匹配a1或a2

awk '/mysql/' /etc/passwd

awk '/mysql/{print }' /etc/passwd

awk '/mysql/{print $0}' /etc/passwd //三条指令结果一样

awk '!/mysql/{print $0}' /etc/passwd //输出不匹配mysql的行

awk '/mysql|mail/{print}' /etc/passwd

awk '!/mysql|mail/{print}' /etc/passwd

awk -F: '/mail/,/mysql/{print}' /etc/passwd //区间匹配

awk '/[2][7][7]*/{print $0}' /etc/passwd //匹配包含27为数字开头的行，如27，277，2777...

awk -F: '$1~/mail/{print $1}' /etc/passwd //$1匹配指定内容才显示

awk -F: '{if($1~/mail/) print $1}' /etc/passwd //与上面相同

awk -F: '$1!~/mail/{print $1}' /etc/passwd //不匹配

awk -F: '$1!~/mail|mysql/{print $1}' /etc/passwd

IF语句

必须用在{}中，且比较内容用()扩起来

awk -F: '{if($1~/mail/) print $1}' /etc/passwd //简写

awk -F: '{if($1~/mail/) {print $1}}' /etc/passwd //全写

awk -F: '{if($1~/mail/) {print $1} else {print $2}}' /etc/passwd //if...else...

条件表达式

== != > >=

awk -F":" '$1=="mysql"{print $3}' /etc/passwd

awk -F":" '{if($1=="mysql") print $3}' /etc/passwd //与上面相同

awk -F":" '$1!="mysql"{print $3}' /etc/passwd //不等于

awk -F":" '$3>1000{print $3}' /etc/passwd //大于

awk -F":" '$3>=100{print $3}' /etc/passwd //大于等于

awk -F":" '$3<1{print $3}' /etc/passwd //小于

awk -F":" '$3<=1{print $3}' /etc/passwd //小于等于

逻辑运算符

&&　||

awk -F: '$1~/mail/ && $3>8 {print }' /etc/passwd //逻辑与，$1匹配mail，并且$3>8

awk -F: '{if($1~/mail/ && $3>8) print }' /etc/passwd

awk -F: '$1~/mail/ || $3>1000 {print }' /etc/passwd //逻辑或

awk -F: '{if($1~/mail/ || $3>1000) print }' /etc/passwd

数值运算

awk -F: '$3 > 100' /etc/passwd

awk -F: '$3 > 100 || $3 < 5' /etc/passwd

awk -F: '$3+$4 > 200' /etc/passwd

awk -F: '/mysql|mail/{print $3+10}' /etc/passwd //第三个字段加10打印

awk -F: '/mysql/{print $3-$4}' /etc/passwd //减法

awk -F: '/mysql/{print $3*$4}' /etc/passwd //求乘积

awk '/MemFree/{print $2/1024}' /proc/meminfo //除法

awk '/MemFree/{print int($2/1024)}' /proc/meminfo //取整

输出分隔符OFS

awk '$6 ~ /FIN/ || NR==1 {print NR,$4,$5,$6}' OFS="\t" netstat.txt

awk '$6 ~ /WAIT/ || NR==1 {print NR,$4,$5,$6}' OFS="\t" netstat.txt

//输出字段6匹配WAIT的行，其中输出每行行号，字段4，5,6，并使用制表符分割字段

输出处理结果到文件

①在命令代码块中直接输出 route -n|awk 'NR!=1{print > "./fs"}'

②使用重定向进行输出 route -n|awk 'NR!=1{print}' > ./fs

格式化输出

netstat -anp|awk '{printf "%-8s %-8s %-10s\n",$1,$2,$3}'

printf表示格式输出

%格式化输出分隔符

-8长度为8个字符

s表示字符串类型

打印每行前三个字段，指定第一个字段输出字符串类型(长度为8)，第二个字段输出字符串类型(长度为8),

第三个字段输出字符串类型(长度为10)

netstat -anp|awk '$6=="LISTEN" || NR==1 {printf "%-10s %-10s %-10s \n",$1,$2,$3}'

netstat -anp|awk '$6=="LISTEN" || NR==1 {printf "%-3s %-10s %-10s %-10s \n",NR,$1,$2,$3}'

IF语句

awk -F: '{if($3>100) print "large"; else print "small"}' /etc/passwd

awk -F: 'BEGIN{A=0;B=0} {if($3>100) {A++; print "large"} else {B++; print "small"}} END{print A,"\t",B}' /etc/passwd

awk -F: '{if($3<100) next; else print}' /etc/passwd //小于100跳过，否则显示

awk -F: 'BEGIN{i=1} {if(i<NF) print NR,NF,i++ }' /etc/passwd

awk -F: 'BEGIN{i=1} {if(i<NF) {print NR,NF} i++ }' /etc/passwd

另一种形式

awk -F: '{print ($3>100 ? "yes":"no")}' /etc/passwd

awk -F: '{print ($3>100 ? $3":\tyes":$3":\tno")}' /etc/passwd

while语句

awk -F: 'BEGIN{i=1} {while(i<NF) print NF,$i,i++}' /etc/passwd

awk数组(重要)

awk的数组，一种关联数组（Associative Arrays），下标可以是数字和字符串。因无需对数组名和元素提前声明，也无需指定元素个数，所以awk的数组使用非常灵活。

首先介绍下几个awk数组相关的知识点：

<1>建立数组

array[index] = value ：数组名array，下标index以及相应的值value

<2>读取数组值

{ for (item in array) print array[item]} # 输出的顺序是随机的

{for(i=1;i<=len;i++) print array[i]} # Len 是数组的长度

netstat -anp|awk 'NR!=1{a[$6]++} END{for (i in a) print i,"\t",a[i]}'

netstat -anp|awk 'NR!=1{a[$6]++} END{for (i in a) printf "%-20s %-10s %-5s \n", i,"\t",a[i]}'

9523 1

9929 1

LISTEN 6

7903 1

3038/cupsd 1

7913 1

10837 1

9833 1

应用1

awk -F: '{print NF}' helloworld.sh //输出文件每行有多少字段

awk -F: '{print $1,$2,$3,$4,$5}' helloworld.sh //输出前5个字段

awk -F: '{print $1,$2,$3,$4,$5}' OFS='\t' helloworld.sh //输出前5个字段并使用制表符分隔输出

awk -F: '{print NR,$1,$2,$3,$4,$5}' OFS='\t' helloworld.sh //制表符分隔输出前5个字段，并打印行号

应用2

awk -F'[:#]' '{print NF}' helloworld.sh //指定多个分隔符: #，输出每行多少字段

awk -F'[:#]' '{print $1,$2,$3,$4,$5,$6,$7}' OFS='\t' helloworld.sh //制表符分隔输出多字段

应用3

awk -F'[:#/]' '{print NF}' helloworld.sh //指定三个分隔符，并输出每行字段数

awk -F'[:#/]' '{print $1,$2,$3,$4,$5,$6,$7,$8,$9,$10,$11,$12}' helloworld.sh //制表符分隔输出多字段

应用4

计算/home目录下，普通文件的大小，使用KB作为单位

ls -l|awk 'BEGIN{sum=0} !/^d/{sum+=$5} END{print "total size is:",sum/1024,"KB"}'

ls -l|awk 'BEGIN{sum=0} !/^d/{sum+=$5} END{print "total size is:",int(sum/1024),"KB"}' //int是取整的意思

应用5

统计netstat -anp 状态为LISTEN和CONNECT的连接数量分别是多少

netstat -anp|awk '$6~/LISTEN|CONNECTED/{sum[$6]++} END{for (i in sum) printf "%-10s %-6s %-3s \n", i," ",sum[i]}'

应用6

统计/home目录下不同用户的普通文件的总数是多少？

ls -l|awk 'NR!=1 && !/^d/{sum[$3]++} END{for (i in sum) printf "%-6s %-5s %-3s \n",i," ",sum[i]}'

mysql 199

root 374

统计/home目录下不同用户的普通文件的大小总size是多少？

ls -l|awk 'NR!=1 && !/^d/{sum[$3]+=$5} END{for (i in sum) printf "%-6s %-5s %-3s %-2s \n",i," ",sum[i]/1024/1024,"MB"}'

应用7

输出成绩表

awk 'BEGIN{math=0;eng=0;com=0;printf "Lineno. Name No. Math English Computer Total\n";printf "------------------------------------------------------------\n"}{math+=$3; eng+=$4; com+=$5;printf "%-8s %-7s %-7s %-7s %-9s %-10s %-7s \n",NR,$1,$2,$3,$4,$5,$3+$4+$5} END{printf "------------------------------------------------------------\n";printf "%-24s %-7s %-9s %-20s \n","Total:",math,eng,com;printf "%-24s %-7s %-9s %-20s \n","Avg:",math/NR,eng/NR,com/NR}' test0