1. 正则表达式的概念
(1)先来一个例子,当我们描述一个人时,可以从他的年龄,身高来精确匹配,也可以从他的身形—微胖,外貌—微黑来模糊匹配。正则表达式就像是这样,即包括精确匹配的信息,又包括一些模糊信息。
(2)正则表达式是用来描述一组字符串的特征,可以通过特殊字符+普通字符来进行模式描述,从而达到文本匹配的目的。
(3)正则表达式一般用于查找匹配,提交信息验证,特殊替换等。
2. 正则表达式的三要素
字符类:字符类通常描述了字符串的组成成分,比如电话号码就是纯数字,名字一般情况下都是字母组合。
数量限定符:描述这个字符串的符号个数,比如电话号码是11位,身份证号码是18位等。
位置限定符:描述了这个字符串的开头或者结尾部分,比如电话号码是以数字开头,以数字结尾的。
特殊符号:在特定情况下使用。
3. 正则表达式的组成
字符类
示例
这次的示例我们用grep工具做,grep工具支持的两个常见选项:-E :表示使用扩展模式
–color:表示将匹配的字符串高亮显示。
数量限定符
示例
位置限定符
示例
特殊符号
示例
4. 几个练习
1. 查找手机号码
[jinyuyu@localhost progammer]$ cat file
23456789
13484515753
a1234567890
1234567890b
15969617963
18990902357
177189ll437
[jinyuyu@localhost progammer]$ grep -E --color '1[3578][0-9]{9}' file
13484515753
15969617963
18990902357
[jinyuyu@localhost progammer]$ grep -E --color '^1[3578][0-9]{9}$' file
13484515753
15969617963
18990902357
2. 非零的正整数
[jinyuyu@localhost progammer]$ echo 1234 | grep -P --color '^[\+1-9][0-9]*'
1234
[jinyuyu@localhost progammer]$ echo +1234 | grep -P --color '^[\+1-9][0-9]*'
+1234
[jinyuyu@localhost progammer]$ echo -1234 | grep -P --color '^[\+1-9][0-9]*'
[jinyuyu@localhost progammer]$ echo -1234.10 | grep -P --color '^[\+1-9][0-9]*'
[jinyuyu@localhost progammer]$ echo $?
1
3.非零带两个小数的
[jinyuyu@localhost progammer]$ echo -1234.10 | grep -P --color '^[\+1-9][0-9]*'
[jinyuyu@localhost progammer]$ echo $?
1
[jinyuyu@localhost progammer]$ echo "123.02" | grep -E --color '^[1-9][0-9]*\.[0-9]{2}'
123.02
[jinyuyu@localhost progammer]$ echo "123.555" | grep -E --color '^[1-9][0-9]*\.[0-9]{2}'
123.555
[jinyuyu@localhost progammer]$ echo "123.555" | grep -E --color '^[1-9][0-9]*\.[0-9]{2}$'
[jinyuyu@localhost progammer]$ echo "123.55" | grep -E --color '^[1-9][0-9]*\.[0-9]{2}$'
123.55
4. 由数字和英文字母组成的字符串
[jinyuyu@localhost progammer]$ echo "abcd123" | grep -E --color '^[a-zA-Z0-9]+$'
abcd123
5. 腾讯QQ号
[1-9][0-9]{4,}
6. 账号是否合法(字母开头,允许5-16字节,允许字母数字下划线)
^[a-zA-Z][a-zA-Za-9_]{4,15}$