<原创> Linux正则表达式总结
正则表达式:
简单的说,正则表达式就是一套处理字符串的规则和方法。以行为单位对字符串进行处理,通过特殊的符号的辅助,可以快速的过滤,替换某些需要的字符串。运维工作中,会有大量访问日志,错误日志,大数据时代,如何能够快速地过滤出我们需要的内容,这就要告正则表达式。
awk,sed,grep(egrep) 三剑客要想能工作的更高效,那一定离不开正则表达式配合的。
linux里的正则表达式。主要是基于三剑客的正则表达式。
基础正则表达式: BRE
正则表达式实际就是一些特殊字符,赋予了特定的含义而已。
1>^word 搜索以word开头的
2>word$ 搜索以word结尾的
cat oldboy.log
I am oldboy linux teacher.
I like chinese chese,table tennis.
My blog is http://oldboy.blog.51cto.com
My qq is 49000448
my god,my name is not oldboy,but OLDBOY.
grep "^I" oldboy.log 过滤以I开头的
grep "^M" oldboy.log 过滤以M开头的
grep -i "^M" oldboy.log 过滤以M开头的,-i不分区大小写
grep -i "m$" oldboy.log 过滤以M结尾的
3> . 代表且只能代表任意一个字符
echo "not boog" >>oldboy.log
echo "is blog not boog" >>oldboy.log
grep "b.og" oldboy.log
grep -n "." oldboy.log -n 显示行号
4> \ 转义符号,让有着特殊身份意义的字符,胶掉马甲,还原原型。
grep "\." oldboy.log 过滤有 . 的
5> * 重复0个或多个前面的一个字符
echo "49000000448.49448" >>oldboy.log
grep "490*448" oldboy.log
6> .* 匹配所有字符
^.* 以任意多个字符开头
7> [ ] 字符集合的重复特殊字符的符号
grep "b[lo]og" oldboy.log 匹配blog 或boog
8> [ ^word ] 匹配不包含^后的任意一个或多个字符的内容
grep "[^qq]" oldboy.log
9> a\{n,m\} 重复n到m次,前一个重复的字符。{ }大括号需要转义,用egrep不用转义。
\{n,\} 重复至少n次,前一个重复的字符。
\{n\} 重复n次,前一个重复的字符。
grep "490\{2,\}448" oldboy.log
alias egrep='egrep --color=auto' 创建带颜色显示的别名
扩展的正则表达式: ERE (egrep才可以用)
1> + 重复一个或一个以上前面的字符。
egrep "490+448" oldboy.log
grep -E "490+448" oldboy.log
2> ? 重得0个或一个0前面的字符
grep -E "490?448" oldboy.log
3> | 用或的方式查找多个符合的字符串
egrep "3306|1521" /etc/services
4> ( ) 找出“用户组” 字符串。
grep -E "b(lo|oo)g" oldboy.log
man grep , sed,awk 查询正则表达式命令
输入 REQULAR