正则表达式+Re

元字符

. 除了换行符以外的任意一个字符
\w 匹配数字字母下划线
\s 匹配空白符
\d 匹配数字
\n 匹配换行符
\t 制表符

^ 匹配字符串的开始
$ 匹配字符串的结束

\W 匹配非字母或数字或下划线
\D 非数字
\S 非空白

a|b 匹配字符a或者b
() 匹配括号的表达式
[...] 匹配字符组中的字符 =>  [a-zA-Z0-9] [abcde]
[^...] 匹配除了字符组中的所有字符

量词

* 重复0或者多次
+ 重复1次或者多次
	\d+ 数字至少出现1次
? 重复0次或者1{n} 重复n次
	\d{5} 数字出现5{n,} 重复n次或者更多次
{n,m} 重复n到m次

贪婪匹配,惰性匹配

.*:
	尽可能多的去匹配
.*?:
	尽可能少的匹配

其他

re.S  让.能匹配换行符
?P<匹配标识变量名>

re模块

  • findall 返回列表,匹配所有符合的内容
  • finditer,匹配所有符合内容,返回迭代器
    ·
it = re . finditer(ex, str)
for i in it:
	print(it.group())
  • search:返回match对象,检索到一个就返回
  • match:从字符串头部开始匹配
  • 预加载正则
    ··

obj = re.compile(正则expression)
obj.method;(上述方法)
  • 拿到分组
import re
s = """
<div class='jay1'><span id='1'>kk1</span></div>
<div class='jay2'><span id='2'>kk2</span></div>
<div class='jay3'><span id='3'>kk3</span></div>
"""
obj = re.compile(r"<div class='(?P<class>.*?)'><span id='(\d+)'>(.*?)</span></div>", re.S)
res = obj.finditer(s)
for it in res:
    print(it.group("class"))
#输出
jay1
jay2
jay3
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值