正则表达式基础知识和ipv4的正则表达式

正则表达式基础知识
http://deerchao.net/tutorials/regex/regex.htm#metacode
句点符号”.”:		匹配除了换行符意外的任意一个字符
方括号”[ ]”:		匹配方括号之内的任意一个字符
或符号”|”: 		表达逻辑或的关系
星号”*” : 		出现0次或者多次
加号”+” :  		出现一次或者多次
问好”?” :  		出现0次或者一次
花括弧”{n}”:		恰好出现n次
花括弧”{n,m}”:	出现n次到m次
连字符”-”:		表示一个范围
转义字符”\”:	和编程语言中的转义字符意义一致
否符号”^”: 		表示不想要匹配的字符
空白符号”\s”:	匹配所有的空白符号
圆括号”()”:		创建一个组
常用的符号:
\d    	 		[0-9]
\D				[^0-9]
\w				[A-Z0-9]
\W				[^A-Z0-9]
\s		 		[\t\n\r\f]
\S				[^\t\n\r\f]
在介绍分组的时候,举了一个ip地址匹配的例子:
((2[0-4]/d|25[0-5]|[01]?/d/d?)/.){3}(2[0-4]/d|25[0-5]|[01]?/d/d?)
这个表达式的/d/d?)处应该修改为/d?/d 分析如下:
1)IP地址的长度为32位,分为4段,每段8位,用十进制数字表示,每段数字范围为0~255,段与段之间用英文句点“.”隔开。以255.226.168.1为例,可以分析出IP地址的组成特点,250——255、200——249、0——199
2)
250——255,用正则可以写成:25[0-5];
200——249可以这样写:2[0-4]/d;
0——199有些麻烦,不过可以继续分拆,这样写起来更加简单明了,0——9、10——99、100——199,这样分开考虑,就得到了三个式子:/d、/d/d(有冗余)、1/d/d,这三个式子我们可以像合并同类项一样把它们合并到一起:[01]?/d?/d
这样,一段地址的表达式就是:2[0-4]/d|25[0-5]|[01]?/d?/d 
后三段每段数字之前都有一个“.”号,合并起来考虑,前三段数字可以写到一起,第四段单独写,合并得到ip地址匹配的正则表达式:
((2[0-4]/d|25[0-5]|[01]?/d?/d)/.){3}(2[0-4]/d|25[0-5]|[01]?/d?/d)

阅读更多
个人分类: 一点小结
想对作者说点什么? 我来说一句

没有更多推荐了,返回首页

加入CSDN,享受更精准的内容推荐,与500万程序员共同成长!
关闭
关闭