正则入门1

最新推荐文章于 2024-08-08 07:15:00 发布

doupi520

最新推荐文章于 2024-08-08 07:15:00 发布

阅读量372

点赞数

分类专栏：正则文章标签：正则

正则专栏收录该内容

2 篇文章 0 订阅

订阅专栏

一、入门：正则字符

关于正则字符，很多文章都会讲到，足足有一篇文章才能描述清楚，我这里就不多说，对于我，平时，常用的有：

1. `.` 匹配不包括换行的任意字符

在php的s修饰符下面可以匹配换行，如$pattern='#<div>(.*?)</div>#s';就可以匹配div内容有换行的数据。

2. `\s` 空格、tab、换行

[\s\S]表示匹配任意字符，\S是\s的反义。
注意区分[\s\S]与.的区别。

3. `*` 匹配零个或更多个，即0~n

4. `+` 匹配一个或更多个，即至少一个，1~n

5. `\` 转义

一个特殊字符前加\就表示转义，说明把它当普通字符用

6. `[]` 单字符取一个，比如[abc]会匹配`a或b或c`

但是，如果[]里面加上^则会变成排除这个字符，如[^abc]就表示不是a、不是b、也不是c
另外，在[]里面可以使用-表示一个范围，如[0-9]表示从0到9，类似的还有[a-zA-Z]，如果要包含-字符，可以给它加上转义[\-]。
关于[]常见的错误用法是：[ab|bc]用来表示ab或bc，实际上，它得到的结果是[abc|]，即a或b或c或|这4个字符（单字符）的任意一个。这里可以改成(ab|bc)。
总结：[]里面的特殊符有五个：[]-\^，其他字符都是普通字符，包括*.?等。
说明：
* ^在[^ 的首位时候才有特殊意义
* [0-9 -在不是首尾的时候有特殊意义
* \[ \] 因为占用[] 本身字符，所以有特殊意义
* \本身是转义符，有特殊意义

7. `^` 字符串开始

这里的^跟[]里面用的^是同一个字符，但是却不是一个意思，这里它表示整个字符串的开始，比如^www表示以www开头的字符串，注意区分，不在[]里面的是开始符，在里面的排除

8. `$` 字符串结束

9. `{1,3}` 循环次数

[0-9]{1,3}表示在0-9的范围里面循环1个、2个或者3个，可能结果有5、20、415等。
如果循环指定次数，如3次，则{3,3}可以简写成{3}。
如果刚好需要匹配字符{1}，则正则需要给{进行转义，得到\{1}的正则。
如果{}中间不是数字，则{}本身不需要转义。

10. `?` 有两个用法

（1）匹配一个或零个

比如https?匹配的https（一个s）或者http（零个s）

（2）非贪婪模式

所谓非贪婪模式，就是匹配尽可能少的内容，比如，对于源字符串

 
 <div>a</div><div>b</div>

使用<div>(.*?)</div>会得到2个结果（注意：如果源字符串有换行，使用[\s\S]替换 . ）：

 
 <div>a</div>

和

 
 <div>b</div>

因为，当遇到第一个</div>，非贪婪模式就不会再往后找了。
而使用<div>(.*)</div>（贪婪模式）则会得到整个字符串

 
 <div>a</div><div>b</div>

，因为它会匹配所有字符直到后面再找不到</div>。

更多关于?的使用，可以参考《正则表达式匹配次数》

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。