正则表达式记录

痘痘飞

已于 2023-05-10 11:00:32 修改

阅读量56

点赞数

文章标签：正则表达式

于 2023-03-28 17:19:43 首次发布

本文链接：https://blog.csdn.net/wbshuaiq/article/details/129820544

版权

正则表达式

字符	解释
\d	任意一个数字,0～9中的任意一个
\w	任意一个字母或数字或下划线，也就是A～Z,a～z,0～9,_中任意一个
\s	包括空格、制表符、换行符等空白字符的其中任意一个
.	小数点可以匹配任意一个字符，但是不包括\n，如果要匹配包括\n在内的所有字符，一般用[\s\S]

除了“.”之外都区分大小写，大写就是相反的意思

除了^-\之外的特殊符号，如果被包含在中括号中，则失去特殊意义

默认量词匹配模式为贪婪模式，也就是能多匹配就多匹配，如果在量词后加上"?"则会更改为非贪婪模式，意思是满足最低匹配规则就停止继续匹配。

例如:“123456"如果是匹配”\d{2,6}“的话则会匹配到:“123456”，如果是匹配”\d{2,6}?“的话则会分别匹配到"12”,“34”,“56”

字符	解释
^	匹配字符串开始的位置
$	匹配字符串结束的位置
\b	匹配一个单词的边界，在匹配中不光hello是一个单词，hello123也会被当作一个单词
(?=exp)	该位置后面会匹配到exp
(?<=exp)	该位置前面会匹配到exp
(?!exp)	该位置后面不会匹配到exp
(?<!exp)	该位置前面不会匹配到exp

位置匹配不会匹配到带有宽度的字符，而仅仅是匹配位置，可以理解成位置的逻辑判断

字符	解释
IgnoreCase	忽略大小写模式
SingleLine	单行模式，是否将整个字符视为一行，只有一个开头和结尾，同时".“可以匹配到”\n"
MultiLine	多行模式，每行字符都有独自的开头和结尾，此时如果要匹配绝对开头或结尾则需要使用"\A"和"\Z"代替"^“和”$"

不同软件或语言中匹配模式的英文单词不一定是"IgnoreCase"、“SingleLine”、“MultiLine”，请根据实际情况作出判断(例如有时候忽略大小写的单词为CaseInsensitive，多行模式的英文单词为LineBreak)，大多数情况下默认的匹配模式为:区分大小写、多行模式

例如:

"goto gogo"这串字符

如果匹配 “[a-z]{2}” 的话,则会匹配到"go",“to”,“go”,“go”；

如果是匹配 “([a-z]{2})\1” 的话,则会匹配到:“gogo”；

如果是匹配 “(?:[a-z]{2})\1” 的话,则什么都匹配不到。

引用可能会造成性能降低，所以尽可能的使用(?:exp)这种形式

关注