Python之爬虫学习记录簿(3)

基本库更完了,更一下re,当然只是用于提取信息的简略内容。
re官方文档:re文档

常用方法

1,match()—尝试从字符串起始位置匹配正则表达式,如果匹配,返回匹配成功的结果,否则返回None。
.*匹配任意尽可能多的字符,.*?匹配尽可能少的任意字符。
2,search()—扫描整个字符串,返回第一个匹配成功的结果。
3,findall()—搜索整个字符串,返回匹配的所有内容。
4,sub()—替换文本中所有符合规则的字符串
5,compile()—可以将正则字符串编译成正则表达式对象,这个方法也是在爬取信息时用的最多的方法。

实例演示

通过编写正则表达式匹配来抓取需要的信息,并整合储存。实例抓取猫眼电影TOP100电影。代码地址:代码

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值