正则表达式

最新推荐文章于 2024-09-17 15:02:08 发布

qq_45651858

最新推荐文章于 2024-09-17 15:02:08 发布

阅读量72

点赞数

分类专栏： shell脚本文章标签：正则表达式开发语言

本文链接：https://blog.csdn.net/qq_45651858/article/details/127297533

版权

shell脚本专栏收录该内容

3 篇文章 0 订阅

订阅专栏

参考：

正则表达式30分钟入门：https://deerchao.cn/tutorials/regex/regex.htm#contact
regex101：https://regex101.com/
正则表达式全解析+常用示例：http://t.csdn.cn/r9Qjp
常用正则表达式合集，这一篇就够了！！（含完整案例，建议收藏）：http://t.csdn.cn/yo5w1

学习过程

元字符

代码	说明
.	匹配除换行符以外的任意字符
\w	匹配字母或数字或下划线或汉字
\s	匹配任意的空白符
\d	匹配数字
\b	匹配单词的开始或结束
^	匹配字符串的开始
$	匹配字符串的结束

重复

代码/语法	说明
*	重复零次或更多次
+	重复一次或更多次
?	重复零次或一次
{n}	重复n次
{n,}	重复n次或更多次
{n,m}	重复n到m次

字符类

代码	说明
[abc]	指定字符
[a-c]	指定范围

分支

代码	说明
\|	分支条件

分组

代码	说明
( )	分组

反义

代码/语法	说明
\W	匹配任意不是字母，数字，下划线，汉字的字符
\S	匹配任意不是空白符的字符
\D	匹配任意非数字的字符
\B	匹配不是单词开头或结束的位置
[^x]	匹配除了x以外的任意字符
[^aeiou]	匹配除了aeiou这几个字母以外的任意字符

后向引用

后向引用用于重复搜索前面某个分组匹配的文本。例如，\1代表分组1匹配的文本。

例如：\b(\w+)\b\s+\1\b可以用来匹配重复的单词

可以不使用\1，自己指定子表达式的组名。要指定一个子表达式的组名，请使用这样的语法：(?<Word>\w+) (或者把尖括号换成’也行： (?‘Word’\w+))

零宽断言

确保某个字符出现，但并不想去匹配它。
可以理解为像\b,^,$那样用于指定一个位置。

代码	说明	实例
(?=exp)	也叫零宽度正预测先行断言，它断言自身出现的位置的后面能匹配表达式exp。	比如\b\w+(?=ing\b)，匹配以ing结尾的单词的前面部分(除了ing以外的部分)，如查找I’m singing while you’re dancing.时，它会匹配sing和danc。
(?<=exp)	也叫零宽度正回顾后发断言，它断言自身出现的位置的前面能匹配表达式exp。	比如(?<=\bre)\w+\b会匹配以re开头的单词的后半部分(除了re以外的部分)，例如在查找reading a book时，它匹配ading。

负向零宽断言

只是想要确保某个字符没有出现，但并不想去匹配它

代码	说明	实例
(?!exp)	断言此位置的后面不能匹配表达式exp。	\d{3}(?!\d)匹配三位数字，而且这三位数字的后面不能是数字；\b((?!abc)\w)+\b匹配不包含连续字符串abc的单词。
(?<!exp)	零宽度负回顾后发断言来断言此位置的前面不能匹配表达式exp	(?<![a-z])\d{7}，匹配前面不是小写字母的七位数字。

贪婪和懒惰

代码/语法	说明
*?	重复任意次，但尽可能少重复
+?	重复1次或更多次，但尽可能少重复
??	重复0次或1次，但尽可能少重复
{n,m}?	重复n到m次，但尽可能少重复
{n,}?	重复n次以上，但尽可能少重复