python正则表达式通配符_URL 通配符与正则表达式

1、通配符:

通配符,即 * 符号,可以添加在url中,代替任意字符。假设您添加的网站域名是url.com,则通配符的使用规则如下:

网站域名后不能直接添加通配符,如url.com这种方式会提示错误;通配符与域名至少间隔一个字符,如url.com?abab需用url.com? 来表示;

url.com/*,表示包含url.com/ 这个形式的所有url,如 url.com/abab,url.com/abab/cdcd等;

url.com/abab*,表示包含url.com/abab这个形式的所有url,如 url.com/abab,url.com/ababcd,url.com/abab/cdcd等;

url.com/*.html,表示包含url.com/ 这个形式,且以 html 结尾的所有url,如url.com/abab.html等。

2、正则表达式

正则表达式是指匹配或捕获字段的若干部分的特殊字符以及支配这些字符的规则,比如:

“.”:匹配任何单个字符(字母、数字或符号),如bai.du与baigdu和bai8du匹配;

“?”:匹配0个或1个先前项,labou?r与labor和labour都匹配;

“”:匹配0个或多个先前项,labor与labr和labour都匹配;

“+”:与星号的用法一样,只不过加号前至少必须匹配一个先前项;如+aidu和baidu、abaidu都匹配;

“|”:执行“或”匹配,a|b与a或b匹配;

“()”:使用圆括号创建项,而不使用默认项,如love(ableIly)匹配loveable或lovely;

“[]”:创建要匹配的项列表,www.aaa.com/mp[1-4]可以匹配www.aaa.com/mp1、www.aaa.com/mp2、www.aaa.com/mp3、www.aaa.com/mp4;

“-”:与方括号联合使用,用来扩展您的列表,如上例中的[1-4];

“$”:要求您的数据位于字段末尾,如www.aaa.com/mp[1-4]$就不能匹配www.aaa.com/mp5或者www.aaa.com/mp11等;

“^”:要求您的数据位于字段开头,如^baidu匹配所有以baidu开头的行;

“\”:将正则表达式字符转换为普通字符,如您选择了“是”使用正则表达式来设置,而您的URL本来为www.baidu.com,而“.”恰好是正则元字符,则您在设置正则表达式时需要将您的URL转义为www.baidu.com。

“{}”:一般与非负整数一齐使用,匹配确定的 n 次。例如,'o{2}' 不能匹配 "Bob" 中的 'o',但是能匹配"food" 中的两个 o。

由于正则表达式的含义复杂、操作困难,为了避免系统误判为您带来不必要的困扰,请在提交您的设置之前认真检查,注意转义,以确保您所设置的正则表达式完整、正确、能被系统识别且没有歧义。

以上符号为目前本网站支持的所有正则表达式字符。

  • 0
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值