正则

最新推荐文章于 2023-05-24 10:07:00 发布

雨醉东风

最新推荐文章于 2023-05-24 10:07:00 发布

阅读量311

点赞数

分类专栏：正则文章标签：正则表达式 python regex java

本文链接：https://blog.csdn.net/zhangxuelong461/article/details/103832127

版权

正则专栏收录该内容

1 篇文章 0 订阅

订阅专栏

正则

【元字符】

（即正则表达式中有特殊含义的符号）

１. 普通字符
元字符：
abc
匹配规则：
匹配相应的字符

２．或
元字符：
|
匹配规则：
匹配｜两边任意一个正则表达式的内容

注意：
	｜　两侧不要加没用的空格，不然表示ab ,

３．匹配单一字符
元字符：
·（点）
匹配规则：
匹配除换行外的任意字符
(两个字符用两个点)

４．匹配开始位置
元字符：^
匹配规则：匹配一个字符串的开头位置

５．匹配结束位置
元字符：$
匹配规则：匹配目标字符串的结束位置

６．匹配重复
元字符：*
匹配规则：匹配前面的正则表达式0次或多次

７．匹配重复
元字符：+
匹配规则：匹配前面的正则表达式一次或多次

８．匹配重复
元字符：？
匹配规则：匹配前面的正则表达式0次或1次

９．匹配重复
元字符：{n}
匹配规则：匹配指定的重复次数

１０．匹配重复
元字符：{m,n}
匹配规则：匹配前面的正则表达式m-n次
ab{3,5}–> abbb abbbb abbbbb

１１．匹配字符集合
元字符：[字符集]
匹配规则：匹配括号内的任意一个字符
[abc123d]—> a b c 1 2 3 d
[a-z]
[A-Z]
[0-9]
[123a-zA-Z]匹配任意的小写字母，大写字母，数字123

１２．匹配字符集合
元字符：[^字符集]
匹配规则：匹配除了括号中字符集的任意一个字符

１３.匹配任意（非）数字字符
元字符：\d \D
匹配规则：\d匹配任意数字字符（[0-9]） \D匹配任意非数字字符([^0-9])

１４．匹配普通字符/非普通字符
普通字符：数字字母下划线
元字符：　\w \W
匹配规则：\w匹配普通字符([_0-9a-zA-Z])，\W匹配非普通字符(^_0-9a-zA-Z)
注意：\w可以匹配普通的utf-8字符（比如汉字）

１５．匹配空字符/非空字符
空字符：([空格\n\t\r]等)
元字符：\s \S
匹配规则：\s空字符　\S非空字符

１６．匹配起止位置
元字符：\A \Z
匹配规则：\A 匹配开始位置（^）　\Z匹配结束位置($)
注意：绝对匹配：使用开头和结尾位置的元字符串将正则表达式放在其中，则目标字符串仅有正则匹配内容时才能匹配上

１７．匹配（非）单词边界位置
普通字符和非普通字符的边界处为单词边界
元字符：\b \B
匹配规则：\b单词边界位置　\B非单词边界

注意：加上r

总结：

匹配单个字符：a	. \d \D \w \W \s \S [字符集] [^..] 
匹配重复性：* + ? {n} {m,n}
匹配位置：^ $ \A \Z \b \B
其他：| () \

【转义字符】

１．正则表达式特殊符号：
. * ? $ [] {} () ^ |

２．如果想匹配特殊符号则加转义

【贪婪和非贪婪】

１．贪婪模式：
正则表达式的重复匹配默认总是尽可能多的向后匹配内容
在 * + ? {m,n} 这四种情况下会产生贪婪模式

２．非贪婪模式：
尽可能少的匹配内容

３．贪婪模式—>非贪婪模式 *? +? ?? {m,n}?

【正则表达式分组】

使用()可以为一个正则表达式建立子组，子组并不会影响正则表达式的整体匹配内容，子组可以看做是一个内部的整体部分

１．子组的作用：

子组可以改变正则表达式的重复行为
子组在某些操作中可以被单独提取出来

２．子组的使用注意事项：
1.一个正则表达式中可以有多个子组（由外到内，由左到右为第一第二……子组）

３．捕获组和非捕获组（命名组和非命名组）：
子组的命名格式：
（?Ppattern）
pattern是正则表达式，name就是名字
命名的优点：
1.很多编程接口可以直接通过名字获取子组匹配内容
2.命名组可以被重复使用
重复调用的方法：
(?P=name)

【正则表达式使用要求：】

1.唯一性：正则表达式只能匹配目标类别字符串，而不能匹配其他内容
2.准确性：尽可能全面的考虑目标类别的字符串特征，做到不遗漏

雨醉东风

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
正则

正则【元字符】（即正则表达式中有特殊含义的符号）１. 普通字符元字符：abc匹配规则：匹配相应的字符２．或元字符：|匹配规则：匹配｜两边任意一个正则表达式的内容注意：｜　两侧不要加没用的空格，不然表示ab ,３．匹配单一字符元字符：·（点）匹配规则：匹配除换行外的任意字符(两个字符用两个点)４．匹配开始位置元字符：^匹配规则：匹配一个字符串的开头位...
复制链接

扫一扫

专栏目录