本人在学习正则表达式时,整理出来方便以后使用时可查阅!
符号 含义
. 通配符(可匹配任意字符串)
[Rr] 匹配表达式[]内的任意一个字符
[0-9],\d 匹配0-9中任意一个数字(\D为匹配任意一个非数字)
[A-Z],[a-z] 匹配[A-Z],[a-z]中的任意一个字母
[Rr]+ 匹配至少一个表达式中的内容(即+号前表达式的内容)
* 匹配任意字符串,0个或多个
? 在?前面的字符串,要么出现一次,要么不出现,如http?,可匹配http和https
^ 取非,如[^0-9],表示非0-9中任何一个数字
\f 换页
\n 换行
\r 回车
\t 制表(tab键)
\v 垂直制表符
[\b] 回退(并删除)一个字符(backspace)
\w 任意一个字母数字字符或下滑线,等价于[0-9A-za-z_]
\W 任意一个非字母数字下滑线字符,等价于[^0-9A-za-z_]
\s 任意一个空白字符,等价于[\f\n\r\t\v]
\S 任意一个非空白字符,等价于[^\f\n\r\t\v]
{2,4} 表达式内容最少重复2次,最多重复4次。{2,}表示表达式内容必须至少2次或更多次
*,+,{2,} 为贪婪形,无限匹配
*?,+?,{2,}? 为懒惰型,匹配一次
\b-\b 边界字符,即只匹配\b\b中的内容
\B-\B 匹配非单词符
?m 必须出现在整个模式的最前面,查找一个
& 配合使用表示指定字符串的开始和结束,与?m结合使用还将匹配一个换行处开头
(和) 表达式集合(通常作为子表示)
| 或者
(\d{1,3}\.){3}\d{1,3} 嵌套表达式,可表示查找ip(192.168.122.12)
<[Hh][1-6]>.*?</[Hh][1-6]> 组合表达式,可查找<h1>sdf</h1>等标签
[ ]+(\w+)[ ]+\1 回溯,找出重复出现的字符,如of of。\1代表第一个表达式,\2代表第二个表达式
<[Hh][1-6]>.*?</[Hh][1-6]\1> 组合表达式
回溯替换表达式
向前查找表达式
向后查找表达式