学习爬虫第二天

import requests

url="https://movie.douban.com/j/chart/top_list"
#重新封装参数
param={
    "type":"24",
    "interval_id":"100:90",
    "action":" ",
    "start":20,
   "limit":20,
}
headers={"User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64; rv:96.0) Gecko/20100101 Firefox/96.0"
}
resp=requests.get(url=url,params=param,headers=headers)
print(resp.json())
resp.close()

import re
#findall:匹配字符串中所有符合正则的内容
list=re.findall(r"\d+","我的qq号是166090685475他的qq号码是18964762492")
print(list)
#效率不高
#迭代器效率高
#finditer 返回迭代器  取出用group
gg=re.finditer(r"\d+","我的qq号是1660906285475他的qq号码是18964762492")
for i in gg:
    print(i.group())
#search返回的结果是match对象,拿数据用group
ff=re.search(r"\d+","我的qq号是166090642575他的qq号码是18964762492")
print(ff.group())#找到一个结果就返回

re.match(r"\d+","我的qq号是16609256106475他的qq号码是18964762492")
#match从头开始匹配

#预加载正则表达式
obj=re.compile(r"\d+")

ret=obj.finditer(r"\d+","我的qq号是166090146475他的qq号码是18964762492")
ret1=obj.findall(r"\d+","我的qq号是16609060256475他的qq号码是18964762492")
#?P<分组名字>正则,可以单独从正则匹配的内容中进一步提取内容
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值