正则表达式

喝可乐的希饭a

已于 2022-03-01 11:15:47 修改

阅读量183

点赞数

分类专栏： java 文章标签：正则表达式前端后端

于 2022-03-01 11:15:19 首次发布

本文链接：https://blog.csdn.net/H_porridge/article/details/123195506

版权

java 专栏收录该内容

4 篇文章 1 订阅

订阅专栏

本文详细介绍了正则表达式的基本语法，包括普通字符、转义字符、标准字符集、自定义字符集合、量词、字符边界和预搜索等概念。此外，还讲解了正则表达式的匹配模式，如IGNORECASE、SINGLELINE和MULTILINE模式，并列举了一些常用的正则表达式实例，如匹配邮箱、URL、电话号码等。通过本文，读者可以深入理解正则表达式的强大功能及其在文本匹配中的应用。

摘要由CSDN通过智能技术生成

前言
正则表达式是一种用来匹配字符串的强有力的武器。
注意：java字符串用\\表示\

正则表达式语法

普通字符
字母、数字、汉字、下划线、以及没有特殊定义的标点符号，都是“普通字符”。表达式中的普通字符，在匹配一个字符串的时候，匹配与之相同的一个字符。
简单的转义字符

标准字符集
–能够与 ‘多种字符’ 匹配的表达式
–注意区分大小写，大写是相反的意思

自定义字符集合
–[ ]方括号匹配方式，能够匹配方括号中任意一个字符

–正则表达式的特殊符号，被包含到中括号中，则失去特殊意义，除了^,-之外。
–标准字符集合，除小数点外，如果被包含于中括号，自定义字符集合将包含该集合。比如：
•[\d.-+]将匹配：数字、小数点、+、-

量词
-修饰匹配次数的特殊符号
匹配次数中的贪婪模式（匹配字符越多越好，默认！）
匹配次数中的非贪婪模式（匹配字符越少越好，修饰匹配次数的特殊符号后再加上一个“?”号）

字符边界
– (本组标记匹配的不是字符而是位置，符合某种条件的位置)

– \b匹配这样一个位置：前面的字符和后面的字符不全是\w

预搜索
–只进行子表达式的匹配，匹配内容不计入最终的匹配结果，是零宽度
–这个位置应该符合某个条件。判断当前位置的前后字符，是否符合指定条件，但不匹配前后的字符。是对位置的匹配。
–正则表达式匹配中，如果子表达式匹配到的是字符内容，而非位置，并被保存到最终匹配结果中，那么就认为这个子表达式是占有字符；如果子表达式匹配的仅仅是位置，或者匹配的内容并不保存到最终的匹配结果中，那么就认为这个子表达式是零宽度的。占有字符还是零宽度，是针对匹配的内容是否保存到最终的匹配结果中而言的。

正则表达式的匹配模式

IGNORECASE忽略大小写模式
–匹配时忽略大小写。
–默认情况下，正则表达式是要区分大小写的。
SINGLELINE单行模式
–整个文本看作一个字符串，只有一个开头，一个结尾。
–使小数点 “.” 可以匹配包含换行符（\n）在内的任意字符。
MULTILINE 多行模式
–每行都是一个字符串，都有开头和结尾。
–在指定了 MULTILINE 之后，如果需要仅匹配字符串开始和结束位置，可以使用 \A 和 \Z

常用正则表达式列表

匹配类型	正则表达式
匹配空白行	\n\s*\r
匹配中文字符	[\u4e00-\u9fa5]
匹配HTML标记	<(\S*?)[^>]>.?</\1>
匹配首尾空白字符	^\sl\s*$
匹配Email地址	\w+([-+.]\w+)@\w+([-.]\w+).\w+([-.]\w+)*
匹配网址URL	[a-zA-z]+://[^\s]*
匹配国内电话号码	\d{3}-\d{8}
匹配腾讯QQ号	[1-9][0-9]{4,}
匹配中国邮政编码	[1-9]\d{5}(?!\d)
匹配身份证	\d{15}l\d{18}
匹配ip地址	\d+.\d+.\d+.\d+