正则表达式概述
正则表达式定义
正则表达式,又称正规表达式、常规表达式
使用字符串来描述、匹配一系列符号某个规则的字符串
正则表达式组成
普通字符
大小写字母、数字、标点符号及一些其他符号
元字符
在正则表达式中具有特殊意义的专用字符
正则表达式层次
基础正则表达式
扩展正则表达式
Linux中文本处理器工具
grep
egrep
sed
awk
基础正则表达式元字符
基础正则表达式是常用的正则表达式部分
除了普通字符外,常见到以下元字符
\:转义字符,!、\n等
^:匹配字符串开始的位置
$:匹配字符串结束的位置
.:匹配除\n之外的任意的一个字符
常见元字符
*:匹配前面子表达式0次或者多次
[list]:匹配list列表中的一个字符
[root@localhost ~]# echo ab | grep [abc]
ab
[root@localhost ~]# echo ABC | grep [a-zA-Z]
ABC
[root@localhost ~]# echo good | grep "go\{1,3\}d"
good
[root@localhost ~]# echo good | grep "go\{2\}d"
good
[root@localhost ~]# echo goood | grep "\<goo"
goood
扩展正则表达式是对基础正则表达式的扩充深化
扩展元字符
+:匹配前面子表达式1次以上
?:匹配前面子表达式0次或者1次
():将括号中的字符串作为一个整体
|:以或的方式匹配字符串
[root@localhost ~]# echo goood | egrep "go+d"
goood
[root@localhost ~]# echo gd | egrep "g?d"
gd
[root@localhost ~]# echo sddgoodeed | egrep "(good)"
sddgoodeed
[root@localhost ~]# echo sddgocdgoad | egrep "g(oc|oa)d"
sddgocdgoad
sed工具概述
文本处理工具,读取文本内容,根据指定的条件进行处理,如删除、替换、添加等
可在无交互的情况下实现相当复杂的文本处理操作
被广泛应用于Shell脚本,以完成自动化处理任务
sed依赖于正则表达式
工作原理
读取 执行 显示
sed命令格式
常用选项
-e 指定要执行的命令,只有一个编辑命令时可省略
-n 只输入处理后的行,读入时不显示
-i 直接编辑文件,而不输出结果
-f 用指定的脚本文件来处理输入的文本文件
[root@localhost ~]# sed -n '1p' zz.txt
root:x:0:0:root: /root: /bin/bash
[root@localhost ~]# sed -n '3p’ zz.txt
daemon :x:2:2:daemon: fsbin: /sbin/nologin
[root@localhost ~]# sed -n '1,3p’ zz.txt
root:x:0:0:root : / root: /bin/bash
bin:x:1:1:bin: /bin:/ sbin/nologin
daemon : x:2:2:daemon : / sbin:/ sbin/nologin
[root@localhost ~]# sed -nr ' /^root|nologin$/p' zz.txt
root:x:0:0: root: /root: /bin/bash
bin:x:1 :1:bin: /bin: / sbin/nologin
daemon : x: 2:2:daemon : / sbin: / sbin/nologin
adm:x:3:4 : adm: /var/ adm: / sbin/nologin
lp:x:4:7: lp: /var/ spool/ lpd: / sbin/nologin
[root@localhost ~]# sed -n 's,/bin/bash,bbbb,p' zz.txt
root:x:0:0: root: /root: bbbb
rt:x:0:0:rt:/rt: bbbb
rot:x:0:0:rot :/rot:bbbb
rooot:x:0:0:roooit t:/rooot:bbbb
r\oooot:x:0:0:roooot :/roooot:bbbb
ROOT:x:0:0: root:/root:bbbb
[root@localhost ~]# egrep "[0-9]+\.[0-9]+\.[0-9]+\.[0-9]+" ipaddr.txt
IPADDR=192.168.235.100
NETMASK=255.255.255.0
GATEWAY=192.168.235.2
DNS1=114.114.114.114
DNS1=1114.1114.1114.1114
[root@localhost ~]# egrep "[0-9]{1,3}\.[0-9]{1,3}\.[0-9]{1,3}\.[0-9]{1,3}" ipaddr.txt
IPADDR=192.168.235.100
NETMASK=255.255.255.0
GATEWAY=192.168.235.2
DNS1=114.114.114.114