正则记录

最新推荐文章于 2024-09-16 00:24:00 发布

iteye_3941

最新推荐文章于 2024-09-16 00:24:00 发布

阅读量71

点赞数

文章标签： php 人工智能

正则在处理字符方面，是强大的瑞士军刀。

正则表达式很灵活，也并不是经常用到,而且容易忘记。但到了需要用的场合，写不出来，非场尴尬。今天同事就遇到过滤a标签的问题，就把写的正则记录下来吧。

首先温习正则知识。

匹配字符

1).-范围匹配

1.数字匹配
[0123456789]可以简写成[0-9]

2.字母匹配
[a-z]匹配a-z范围小写字母

[0-9a-zA-z]匹配所有数字所有大小写字母

排除字符

[...]列出希望匹配的字符，[^...]排除列出的字符，如排除数字字符可以写成[^0-9]。

元字符

代码/语法说明
. 匹配除换行符以外的任意字符
\w 匹配字母或数字或下划线或汉字
\s 匹配任意的空白符
\d 匹配数字
\b 匹配单词的开始或结束
^ 匹配字符串的开始
$ 匹配字符串的结束

反义

代码/语法说明
\W 匹配任意不是字母，数字，下划线，汉字的字符
\S 匹配任意不是空白符的字符
\D 匹配任意非数字的字符
\B 匹配不是单词开头或结束的位置

重复

代码/语法说明
* 重复零次或更多次
+ 重复一次或更多次
? 重复零次或一次
{n} 重复n次
{n,} 重复n次或更多次
{n,m} 重复n到m次

后向引用

分类代码/语法说明
捕获 (exp) 匹配exp,并捕获文本到自动命名的组里
(?<name>exp) 匹配exp,并捕获文本到名称为name的组里，也可以写成(?'name'exp)
(?:exp) 匹配exp,不捕获匹配的文本，也不给此分组分配组号
零宽断言 (?=exp) 匹配exp前面的位置
(?<=exp) 匹配exp后面的位置
(?!exp) 匹配后面跟的不是exp的位置
(?<!exp) 匹配前面不是exp的位置
注释 (?#comment) 这种类型的分组不对正则表达式的处理产生任何影响，用于提供注释让人阅读

有关正则的知识就温习到这里，详细的正则知识足以写一本书。

下面以前面提到的替换a标签的问题为例，作为讲解。使用的是php语言：

//要解决的方案，把href属性包含有news/*链接的a标签都过滤掉，希望的结果<a href="http://www.xxxx.com.cn/news">主页</a> > 时尚资讯 > 祛黄 >
$string = '<a href="http://www.xxxx.com.cn/news">主页</a> > <a href="/news/a/tengxunwenzhang/">时尚资讯</a> > <a href="/news/a/tengxunwenzhang/txcijiquhuang/">祛黄</a> > ';

/*这行代码的意思把a标签href属性包含news/*链接的a标签都过滤掉，只剩下括号里的条件。
这里的$1就是上面提到的反向引用里的捕获(exp)
$1对应捕获的数目$N对应N个()捕获
*/
echo preg_replace("/<a[^>]*href=['\"]\/news\/[^>]*>([^<]+)<\/a>/i", '$1', $string);

如要过滤所有a标签

echo preg_replace("/<a[^>]*>([^<]+)<\/a>/i", '$1', $string);

学会正则最好的方法，就是多体验，多尝试

iteye_3941

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫