接口测试requests(爬取网页小练习)

接口关联,自动处理cookie

当cookie信息很多时,我们可以使用requests库提供的Session对象自动处理Cookie信息

Session对象会在同一次会话中,自动存储全部的Cookie信息,并在下一次发请求时自动携带Cookie。

Session对象表示客户端和服务端的一次会话,也就是用同一个session对象发送请求就看做成同一个会话

代码实现:

1 创建一个session对象

2 之前通过requrest发送的请求,都用session代替即可

3 这些写的话后面的请求共用cookie,就不用单独再传入cookie了

session = requests.session()
#...
res = session.get(url=url)
res = session.post(url=user_url,headers=headers,data=data)

爬虫练习

爬取n页的标题和时间,写入data.txt文档里

import re
import requests
import time
for page in range(1,11):
    if page == 1:
        url = 'xxx'
    else:
        url = 'xxx/xxx_{}.html'.format(page)
    res = requests.get(url=url)
    res.encoding = 'utf-8'
    html = res.text
    a_ls = re.findall(r'<div class="xwt2_a">(.*?)</div>', html)
    t_ls = re.findall(r'<p class="p3">(.*?)</p>', html)
    with open('demo.txt','a',encoding='utf-8') as f:
        for a,t in zip(a_ls, t_ls):
            title = re.findall(r'title="(.*?)"',a)[0]
            con = '[{}]{}\n'.format(title, t)
            f.write(con)
    print(f'第{page}页爬完')
    time.sleep(1)

最后: 为了回馈铁杆粉丝们,我给大家整理了完整的软件测试视频学习教程,朋友们如果需要可以自行免费领取 【保证100%免费】

 全套资料获取方式:点击下方小卡片自行领取即可

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值