正则表达式,神器!自己看了好几遍相关的内容之后,还是有些东西不是很熟练,还是要多写啊,今天整理下正则表达式的实例,正好巩固一下自己的基础知识。当然,正则表达式一般都是和其它命令搭配使用的,个人现在搭配最多的就是grep
简单说下grep,个人认为,grep其实就是把一整段文字中的某一段拿出来(某一行),而这一行往往是我们去规定符合什么什么要求的,比如我们只输出ip相关的
下面说一下常用的正则表达式原字符....
^ 这个字符表示的行的开始例如:'^grep'匹配所有以grep开头的行
$ 这个字符和楼上相反:表示行的结束'grep$'匹配所有以grep结尾的行
. 这个匹配任何一个非换行字符(自己老是把非换行给忘记了)例如:'gr.p'匹配gr后接一个任意字符,然后是p
*这个字符需要说明一下,这个字符表示匹配零个或多个先前字符,注意此处,匹配0个或多个先前字符不要盲目认为*表示任意字符,例如:'*grep'匹配所有一个或多个空格后紧跟grep的行
[]匹配一个指定范围内的字符,如'[Gg]rep'匹配Grep和grep
[^] 这个和楼上相反,匹配一个不在指定范围内的字符,如:'[^A-FH-Z]rep'匹配不包含A-R和T-Z的一个字母
开头,紧跟rep的行
\(..\) 标记匹配字符,如'\(love\)',love被标记为1。,这个牛B了,自己楞是没明白啥意思....大牛赐教啊
\< 这个表示锚定单词的开始,如:'\<grep'匹配包含以grep开头的单词的行,这个是单词,刚刚那个^是行
\>这个和楼上相反,锚定单词的结束,如'grep\>'匹配包含以grep结尾的单词的行
x\{m\},这个在IP地址,电话号码等用的比较多重复字符x,m次,如:'0\{5\}'匹配包含5个0的行,这个时候那个\是转义的意思。
x\{m,n\}重复字符x,至少m次,不多于n次,如:'o\{5,10\}'匹配5--10个0的行。
\w 这个自己老是记不住啊.....匹配文字和数字字符,也就是[A-Za-z0-9],如:'G\w*p'匹配以G后跟零个或多个文字或
数字字符,然后是p。
\W这个大写的和楼上的不一样的,\w的反置形式,匹配一个或多个非单词字符,如点号句号等。
\b 单词锁定符,如: '\bgrep\b'只匹配grep
+ 匹配一个或多个先前的字符。如:'[a-z]+able',匹配一个或多个小写字母后跟able的串,如loveable,enable,disable等。
? 匹配零个或多个先前的字符。如:'gr?p'匹配gr后跟一个或没有字符,然后是p的行。 a|b|c 匹配a或b或c。如:grep|sed匹配grep或sed
() 分组符号,如:love(able|rs)ov+匹配loveable或lovers,匹配一个或多个ov。 x{m},x{m,},x{m,n} 作用同x\{m\},x\{m,\},x\{m,n\}
yishjyishang
+?()是进阶的,大家没事的时候可以看看,
下边是几个例子,自己也学习下,记录一下:
ls -l | grep '^a' 通过管道过滤ls -l输出的内容,只显示以a开头的行
grep 'test' d* 显示所有以d开头的文件中包含test的行
grep 'test' aa bb cc 显示在aa,bb,cc文件中匹配test的行
grep '[a-z]\{5\}' aa 显示所有包含每个字符串至少有5个连续小写字符的字符串的行(aa中)
这个来了,终极奥义,必杀
grep 'w\(es\)t.*\1' aa
如果west被匹配,则es就被存储到内存中,并标记为1,然后搜索任意个字符(.*),这 些字符后面紧跟着另外一个es(\1),找到就显示该行。如果用egrep或grep -E,就不 用"\"号进行转义,直接写成'w(es)t.*\1'就可以了。
这句话完全摸不着边际啊,貌似多看几遍有点懂的意思,类似与位置变量,也就是说\(es)\表等同于后边的1,应该可以写成这样
grep 'w\(es)\t.*es'
个人感觉应该是这样,大牛赐教.....