文章目录
一、正则表达式
1.1正则表达式的定义
- 正则表达式,又称正规表达式、常规表达式
- 使用字符串来描述、匹配一系列符合某个规则的字符串
- 正则表达式的组成
①普通字符
大小写字母、数字、标点符号及一些其他符号
②元字符
在正则表达式中具有特殊意义的专用字符
1.3文本处理工具
grep
egrep
sed
awk
1.4基础正则表达式元字符
*基础正则表达式是常用的正则表达式部分
*常见的以下元字符
\ :转义字符,\!、\n
^ :匹配字符串开始的位置(^a、^the、^#)
$ :匹配字符串结束的位置 (word$)
. :匹配除\n之外的任意的一个字符(go.d、g..d)
* :匹配前面子表达式0次或者多次
[list] :匹配list列表中的一个字符([abc] [a-z])
[^lsit] :匹配任意不在list列表中的一个字符([^a-z] [^0-9])
\{
n,m} :匹配前面的字表达n到m次,有\[n\}、\{
n,\}、\{
n.m\}
1.5扩展正则表达式元字符
- 扩展正则表达式是对基础正则表达式的扩充深化
- 扩展元字符
+ :匹配前面子表达式1次以上(go+d)
?:匹配前面子表达式0次挥着1次(go?d)
() :将括号中的字符串作为一个整体(xyz)+