正则记录

正则在处理字符方面,是强大的瑞士军刀。

正则表达式很灵活,也并不是经常用到,而且容易忘记。但到了需要用的场合,写不出来,非场尴尬。今天同事就遇到过滤a标签的问题,就把写的正则记录下来吧。

首先温习正则知识。

匹配字符

1).-范围匹配

1.数字匹配
[0123456789]可以简写成[0-9]

2.字母匹配
[a-z]匹配a-z范围小写字母

[0-9a-zA-z]匹配所有数字所有大小写字母

排除字符

[...]列出希望匹配的字符,[^...]排除列出的字符,如排除数字字符可以写成[^0-9]。

元字符

代码/语法 说明
. 匹配除换行符以外的任意字符
\w 匹配字母或数字或下划线或汉字
\s 匹配任意的空白符
\d 匹配数字
\b 匹配单词的开始或结束
^ 匹配字符串的开始
$ 匹配字符串的结束

反义

代码/语法 说明
\W 匹配任意不是字母,数字,下划线,汉字的字符
\S 匹配任意不是空白符的字符
\D 匹配任意非数字的字符
\B 匹配不是单词开头或结束的位置

重复

代码/语法 说明
* 重复零次或更多次
+ 重复一次或更多次
? 重复零次或一次
{n} 重复n次
{n,} 重复n次或更多次
{n,m} 重复n到m次

后向引用

分类 代码/语法 说明
捕获 (exp) 匹配exp,并捕获文本到自动命名的组里
(?<name>exp) 匹配exp,并捕获文本到名称为name的组里,也可以写成(?'name'exp)
(?:exp) 匹配exp,不捕获匹配的文本,也不给此分组分配组号
零宽断言 (?=exp) 匹配exp前面的位置
(?<=exp) 匹配exp后面的位置
(?!exp) 匹配后面跟的不是exp的位置
(?<!exp) 匹配前面不是exp的位置
注释 (?#comment) 这种类型的分组不对正则表达式的处理产生任何影响,用于提供注释让人阅读

有关正则的知识就温习到这里,详细的正则知识足以写一本书。

下面以前面提到的替换a标签的问题为例,作为讲解。使用的是php语言:

//要解决的方案,把href属性包含有news/*链接的a标签都过滤掉,希望的结果<a href="http://www.xxxx.com.cn/news">主页</a> > 时尚资讯 > 祛黄 >
$string = '<a href="http://www.xxxx.com.cn/news">主页</a> > <a href="/news/a/tengxunwenzhang/">时尚资讯</a> > <a href="/news/a/tengxunwenzhang/txcijiquhuang/">祛黄</a> > ';

/*这行代码的意思把a标签href属性包含news/*链接的a标签都过滤掉,只剩下括号里的条件。
这里的$1就是上面提到的反向引用里的捕获(exp)
$1对应捕获的数目$N对应N个()捕获
*/
echo preg_replace("/<a[^>]*href=['\"]\/news\/[^>]*>([^<]+)<\/a>/i", '$1', $string);

如要过滤所有a标签

echo preg_replace("/<a[^>]*>([^<]+)<\/a>/i", '$1', $string);


学会正则最好的方法,就是多体验,多尝试


评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值