稳扎稳打学爬虫05—python中re模块的使用

python程序中运用re模块,使用正则

1、findall 查找所有,返回list
str = "你要是没有什么事情,就一起打游戏吧,玩游戏,放松一下嘛"
lst = re.findall('游戏',str)
print(lst)

在这里插入图片描述
在这里插入图片描述

2、search 会进行匹配,如果匹配到了第一个就返回这个结果
lst = re.search('我',"我的电话我要你记住哟,100233,235242001")
print(lst.group())

在这里插入图片描述

3、match 只能从字符串的开头进行匹配
lst = re.match('我的',"我的电话你要记住哟,100233,235242001")
print(lst.group())

在这里插入图片描述

4、finditer 和 findall 差不多,只不过这时返回的是迭代器
str = "你要是没有什么事情,就一起打游戏吧,玩游戏,放松一下嘛"
lst = re.finditer('游戏',str)
for i in lst:
    print(i.group())

在这里插入图片描述

5、compile()可以将一个长长的正则进行预加载,方便后期使用
obj = re.compile('\d{3}')  #将正则表达式编译成为一个正则表达式对象,规则是:要匹配连续的3个数字
ret = obj.findall('嘻嘻哈哈1120,嗯嗯111,怕怕223') #正则表达式对象调用search,参数为待匹配的字符串
print(ret)
若想单独获得正则中的具体内容:分组,起名字
s = """<div class = 'title'><span id = '100'>简笔画</span></div>
<div class = 'main'><span id = '101'>征文主题</span></div>
<div class = 'foot'><span id = '102'>联系电话</span></div>
"""
obj = re.compile("<div class = '(?P<class>.*?)'><span id = '(?P<id>.*?)'>(?P<name>.*?)</span></div>",re.S) #re.S 可以让.匹配任何东西

result = obj.finditer(s)
for it in result:
   # print(it.group())
    print(it.group("class"))
    print(it.group("id"))
    print(it.group("name"))

在这里插入图片描述

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值