python——第十八天

匹配HTML标签的正则:

 r"</?\w+>"

 

 

邮箱的正则:

 [0-9a-zA-Z_]{4,20}@openlab\.com

 

 

|符号在正则中的使用:

 org

 com

 cn

 io

 ……

 

 或符号单个不建议使用,因为和[]的作用一样

 

 而在多个词组中|必须写在一个(),表示一组

 r"[0-9a-zA-Z_]{4,20}@openlab\.(com|org|cn|io|gov)"

 

 

分组:

 正则表达式中二次筛选

分组:正则的二次筛选

s = "<div>这个是内容部分</div>"

r"<\w+>(.*)</\w+>"



正则表达式的表达模式:
贪婪模式|非贪婪模式【懒惰模式】

贪婪模式:尽可能多的去匹配结果
懒惰模式:只要匹配到结果,会立刻返回

*
+
?
{m,}
{m,n}
贪婪模式 <===> 懒惰模式




re模块中的一个常见方法:
compile
findall
finditer
split
match
search

 

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值