python爬虫,请求获得cookies,并且携带cookies的方法

本文介绍了如何使用Python的requests库,通过发送请求获取网站cookies并利用它们抓取XueQiu异步加载的数据,包括两种方法:一是直接操作cookies,二是使用requests.Session管理cookies以实现更高效的数据获取。
摘要由CSDN通过智能技术生成

python代码:

方法一:

# 不需要登录网站,两步拿到数据
# 1.在网站首页发送请求,获取网站cookies
# 2.再次发送请求,携带cookies请求,即可得到数据

import requests
headers = {
    'User-Agent': 'Mozilla/5.0 (Windows NT 6.1; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/103.0.0.0 Safari/537.36',
}
# 给一个
main_url = 'https://xueqiu.com/'
response_main = requests.get(main_url, headers=headers)
print(response_main)
# 获取服务器端响应的cookie
cookies = response_main.cookies
print(cookies)
print(dict(cookies))
# 异步加载数据的url
url = 'https://xueqiu.com/statuses/hot/listV2.json?since_id=-1&max_id=366242&size=15'
response = requests.get(url, headers=headers, cookies=cookies)
print(response)

方法二:

import requests
headers = {
    'User-Agent': 'Mozilla/5.0 (Windows NT 6.1; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/103.0.0.0 Safari/537.36',
}
# 先访问首页 获取到cookie
session = requests.Session()   # 创建一个session对象
main_url = 'https://xueqiu.com/'
# 这里请求的目的就一个 拿到响应的cookie
session.get(url=main_url, headers=headers)

# 访问异步加载的地址 携带着cookie过去,session里面自带cookies,而且随时更新
url = 'https://xueqiu.com/statuses/hot/listV2.json?since_id=-1&max_id=366242&size=15'
res = session.get(url, headers=headers)
print(res)
print(res.json())

 

  • 9
    点赞
  • 13
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值