python爬虫之路——Python的re模块及其方法

介绍常用的三种方法:search(),sub(),findall()

 search():匹配并提取第一个符合规律的内容,然后返回一个正则表达式的对象

#提取字符串中的第一个数字

import re

a='a1b2d3f4'

infos=re.search('\d+',a)

print(infos)

#返回一个正则表达式的对象

print(infos.group())

#return 1

sub():替换

import re

phone='123-456-789'

new_phone=re.sub('\D','',phone)

print(new_phone)

#return 123456789

findall():提取所有符合规律的内容,并返回一个列表。

import re

phone='123-456-789'

new_phone=re.findall('\d+','',phone)

print(new_phone)

#return ['123','456','789']

 

非贪心算法提取所有符合规律的字符串

import re

import request

re=requests.get('http://nj.xiaozhu.com/search-duanzufang-p2-0/')

prices=re.findall('<div class="day_l">¥<span>(.*?)</span><em>起</em></div>',res.test)

for prince in prices:

print(price)

re模块修饰符重点:re.I:大小写不敏感      re.S:换行匹配

prices=re.findall('<div class="day_l">¥<span>(.*?)</span><em>起</em></div>',res.test,re.S)

 

转载于:https://www.cnblogs.com/lanbofei/p/8743541.html

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值