爬虫笔记1-正则表达式

\——将下一个字符标记为特殊字符


定界符

^——匹配输入字符串的开始位置

$——匹配输入字符串的结束位置

\b——匹配一个单词边界,也就是指单词和空格间的位置

\B——匹配非单词边界


个数、次数

*——匹配前面的自表达式零次或者多次

+——匹配前面的子表达式一次或者多次

?——匹配前面的子表达式零次或者一次

{n}——n是一个非负整数

{n,}——n是一个非负整数

{n,m}——m和n均为非负整数,其中n<=m


?——当该字符紧跟在任何一个其它限制符(*,+,?,{n},{n,},{n,m})后面时,匹配模式是非贪婪的

.——匹配除"\n"之外的任何单个字符

x|y——匹配x或y


范围

[xyz]——字符集合

[^xyz]——负值字符集合

[a-z]——字符范围

[^a-z]——负值字符范围


空白符

\f——字符集合

\n——负值字符集合

\r——字符范围

\t——负值字符范围


语法糖

\d——匹配一个数字字符

\D——匹配一个非数字字符

\s——匹配任何空白字符,包括空格、制表符、换页符等等

\S——匹配任何非空白字符

\w——匹配字母、数字、下划线

\W——匹配非字母、数字、下划线



如何在python中使用正则表达式——re模块——1查找:re.search  re.findall     2替换:re.sub

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值