正则表达式

概念

正则表达式是一组由字母、数字和符号组成的特殊文本, 它可以用来从文本中找出满足你想要的格式的字符。简单的说,正则表达式就是对字符串操作的一种逻辑公式。

概念解析:
1、它是一种逻辑公式;
2、一种对字符串操作的逻辑公式;
3、对字符串的一种过滤,搜索符合限定条件(即逻辑公式)的字符串。

正则表达式的基础知识

1.基本匹配

正则表达式其实就是在执行搜索时的格式, 它由一些字母和数字组合而成。例如: 一个正则表达式 the,它表示一个规则:由字母t开始,接着是h,再接着是e,匹配的就是其中的’the’。

"the" => The fat cat sat on *the* mat.

2.占有字符和零宽度

占有字符:正则表达式匹配到的东西,不是一个位置,而且能保存到匹配的结果当中,这样的就叫做占有字符。
零宽度:只匹配一个位置,或者匹配的内容并不保存到匹配结果中,就称作零宽度。

3.元字符

正则表达式主要依赖于元字符,元字符不代表他们本身的字面意思,他们都有特殊的含义,一些元字符写在方括号中的时候有一些特殊的意思。以下是一些元字符的介绍:

元字符描述
.匹配除换行符以外的任意字符
[ ]字符种类. 匹配方括号内的任意字符
[ ^]否定的字符种类. 匹配除了方括号里的任意字符
\b匹配单词开始或结束,它只是匹配一个位置
^锚点,匹配字符串开始
$锚点,匹配字符串结束

4.转义字符

转义字符是专门用在元字符身上的,如果你想要得到元字符本身的话需要使用\来取消这些元字符的特殊意义。
在这里插入图片描述

5.字符类型

首先字符类型是用"[]"包括起来,而且大小写要区分。
例子:
[a-zA-Z0-9] 这个正则表达式表示:匹配一个字符,这个字符可以是a-z范围内或者A-Z范围内或者0-9范围内的任意小写或者大写或数字的字符。
[ABC]这个表示:匹配一个字符,这个字符可以是A,可以是B,也可以是C。

6.重复次数

元字符描述
*匹配>=0个重复的在*号之前的字符
+匹配>=1个重复的+号前的字符
?重复0或1次
{n}重复n次
{n,}重复至少n次
{n,m}重复最少n次,最多m次

7.分支

指的是有几种规则:用“|”把不同的规则分开
例子:[A]|[B]|[C]|[D] 匹配一个字符:这个字符可以是A或B或C或D

8.分组

使用小括号()来指定字表达式:
例子:(\d{1,3}){3}\d{3} 表示:把我们分组的小括号里面的东西重复三次,也就是说我们至少匹配3个最多匹配9个数字,后面再加上三个数字

9.简写字符

简写描述
\w匹配所有字母数字, 等同于 [a-zA-Z0-9_]
\W匹配所有非字母数字, 即符号, 等同于: [^\w]
\d匹配数字: [0-9]
\D匹配非数字: [^\d]
\s匹配所有空格字符, 等同于: [\t\n\f\r\p{Z}]
\S匹配所有非空格字符: [^\s]
\f匹配一个换页符
\n匹配一个换行符
\r匹配一个回车符
\t匹配一个制表符
\v匹配一个垂直制表符
\p匹配 CR/LF (等同于 \r\n),用来匹配 DOS 行终止符

10.标志

标志也叫模式修正符, 因为它可以用来修改表达式的搜索结果. 这些标志可以任意的组合使用, 它也是整个正则表达式的一部分。

标志描述
i忽略大小写
g全局搜索
m多行的;锚点元素^ $工作范围在每行的起始

小结

正则表达式就像是在高考完大学录取学生一样:有的学校要省内的,有的学校要省外的;有的学校收普通学生,而有的学校可能只收艺术特长生;有的学校要分数高的,有的学校还是想要分数高的,开个小玩笑哈。正则表达式就是在匹配字符串的过程中加一些限制条件,然后选出适合的,中意的。

评论 5
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

宋文轩

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值