Python数据分析1——正则表达式之 (.*?)匹配和 \ 转义

正则表达式条目众多、纷繁复杂,我在接触正则的时候就感觉有些摸不着头脑,甚至到现在为止也理得不是很清。每次想要去记一下表达式具体含义时,都会因为太多而不了了之,就想如果用到现查也是不错的选择。

但是有两个正则是我每个爬虫任务都必用的,这两个万金油的正则表达就是**(.*?)和 \ **。在之前所做过的爬虫中我都用这个正则把想要的字给匹配出来,以至于我只会这一个爬虫的匹配字段方式,而没有去接触和了解其他的匹配技术,这是有些遗憾的 。

(.*?)用法简而概之就是:

1.明确原始字符串(其中包含目标字段)和目标字段
2.在原始字符串中找到包含目标字段的句话或者一行或者一段,用(.*?)来替换目标字段。也可以理解为 .*? 替换目标字段,然后用括号把目标字段括起来。
3.匹配的代码是:

re.findall('包含目标字段的一句话或者一行或者一段',原始字符串名,re.S)

###包含目标字段的一句话或者一行或者一段就是从原始字符串里摘出来的一部分,必须要保证目标字段包含在内,并且前后都要有内容。这里有几个注意事

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值