Python : 爬虫--正则表达式

常见的正则字符和含义如下:

. 匹配任意字符,除了换行符

  • 匹配前一个字符 0 次或多次
    
  • 匹配前一个字符 1 次或多次
    ? 匹配前一个字符 0 次或 1 次

^ 匹配字符串开头
$ 匹配字符串末尾

() 匹配括号内表示式,也表示一个组

\s 匹配空白字符
\S 匹配任何非空白字符

\d 匹配数字,等价于[0-9]
\D 匹配任何非数字,等价于[^0-9]

\w 匹配字母数字,等价于[A-Za-z0-9]
\W 匹配非字母数字,等价于[^A-Za-z0-9]

[] 用来表示一组字符

Python 正则表达式有以下 3 种方法:
re.match 方法:从字符串起始位置匹配一个模式,如果从起始位置匹配了,match()就返回none。
语法 re.match(pattern, string, flags=0)
pattern:正则表达式
string:要匹配的字符串
flags:控制正则表达式的匹配方式,如 是否区分大小写、多行匹配等

re.search方法:只能从字符串的起始位置进行匹配。

find_all方法:可以找到所有的匹配。

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值