shell正则表达式
*基础正则表达式 grep sed
*扩展正则表达式 egrep awk
sed grep awk 称为shell三剑客
*
正则表达式定义
*正则表达式,又称正规表达式,常规表达式
*使用字符串来描述.匹配已系列符合某个规则的字符串
*正则表达式组成
普通字符:大小写字母,数字,标点符号及一些其他符号
元字符:在正则表达式中具有特殊意义的专用字符
^ :开头,在[ ]中代表不在此范围内
$ :结尾
. :匹配任意一个字符
- :匹配前面的子表达式0次或者多次
[list] :匹配list列表中的一个字符,如[0-9],匹配1-9中的任意一个数字
[^0-9] :匹配不在0-9外的一个字符
{n} :匹配前面的表达式n次,如[0-9]{2}表示匹配0-9中的两个数字
[0-9]{2,} :表示0-9中两位及以上的数字
\r :匹配除\r外的任意一个字符
{n,m} :匹配前面的子表达式 n到m次,例如[a-z]{2,3}表示匹配两到三位的小写字母.(egrep\awk使用时{}前不加)
下面说说使用正则表达式的几种常用工具:
grep:
grep命令:
grep -n :显示行号
grep -i :显示不区分大小写
grep -v :查找不包含后面的行
grep -n ‘sh[io]rt’ :表示shirt与short
grep -n ‘[^w]oo’ :查找不以w开头,含有oo的行
grep -n ‘.$’ :查找以".“结尾的行(”.“有特殊意义,所以用\转义)
grep -n ‘^$’ :查询空白行
grep -n ‘w…d’ 查找w开头,d结尾的单词,”."代表任意一个字符
grep -n ‘oo*’ "*"重复0个或以上数量的单字符(0.00.000.0000…)
sed:
sed命令:
sed -e :指定要执行的命令,只有一个编辑命令时可省略
sed -n :只输出处理后的行,读入时不显示
sed -i :直接编辑文件,二部输出结果
sed -f :用指定的脚本文件来处理输入的文本文件
egrep(扩展正则表达式)
egrep命令:
- :重复一个或者一个以上的字符
如:egrep -n ‘wo+d’ test.txt即可查询wood,woood…等
? :0个或一个的前一个字符
如:egrep -n ‘bes?t’ test.txt 即可查询bet,best.
| :使用或者(or)的方式找出多个字符
如:egrep -n ‘of|lis|on’ test.txt 可查询of或者if或者on字符
( ) :查找组字符串
如:egrep -n ‘t(a|e)st’ test.txt 即可查询tast与test
( )+ :辨别多个重复的组
如:egrep -n ‘A(xyz)+C’ test.txt 查询开头是A,结尾是C,中间有一个以上的xyz字符串
最后就是以正则表达式匹配E-mail地址:
用户名@:^([a-zA-Z0-9_-.+]+)@
子域名:([a-zA-Z0-9_-.]+)
顶级域名:.([a-zA-Z]{2,5})$