正则相关收藏

最新推荐文章于 2023-10-18 15:25:41 发布

weixin_30498807

最新推荐文章于 2023-10-18 15:25:41 发布

阅读量40

点赞数

原文链接：http://www.cnblogs.com/imcac/p/4236053.html

版权

匹配href对应的内容

hrefs*=s*(?:"([^"]*)"|'([^']*)'|([^"'>s]+))

匹配网址：

[a-zA-Z0-9][-a-zA-Z0-9]{0,62}(?:\.[a-zA-Z0-9][-a-zA-Z0-9]{0,62})+\.?

　　update by 2015-1-21 16:27:20

根据指定标签，匹配指定属性的两则正则

(?:<a|script|link)\s*(?:href|src)\s*=(['"])(.*?)\1[^>]*>

改良=》(?:<a|script|link)(?:\s\S*?)*\s*(?:href|src)\s*=(['"])(.*?)\1[^>]*>
<(?:a|link|script)(?:\s\S*?)*(?:src=['"](.*?)['"])?(?:href=['"](.*?)['"])?(?:\s\S*?)*>

改良=》<(?:a|link|script)(?:\s\S*?)+(?:\s*(?:src|href)\s*=\s*['"](.*?)['"]\s*)?(?:\s\S*?)*>

(?: pattern)是非捕获型括号匹配pattern，但不捕获匹配结果。

(pattern )是捕获型括号。匹配pattern，匹配pattern并捕获结果,自动获取组号

(?<name> pattern ) 匹配pattern，匹配pattern并捕获结果，设置name为组名

使用小括号指定一个子表达式后，匹配这个子表达式的文本(也就是此分组捕获的内容)可以在表达式或其它程序中作进一步的处理。默认情况下，每个捕获组会自动拥有一个组号，规则是：从左向右，以分组的左括号为标志，第一个出现的分组的组号为1，第二个为2，以此类推。

如果正则表达式中同时存在普通捕获组和命名捕获组，那么捕获组的编号就要特别注意，编号的规则是先对普通捕获组进行编号，再对命名捕获组进行编号。

为了避免括号太多使编号混乱，也为了避免无用的捕获提高效率，在不需要捕获只需要指定分组的地方就可以使用非捕获型括号。问题里的非捕获型括号就是为此使用的。

转载于:https://www.cnblogs.com/imcac/p/4236053.html

weixin_30498807

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。