python的requests在网络请求中添加cookies参数

最新推荐文章于 2024-07-24 10:39:56 发布

Winterto1990

最新推荐文章于 2024-07-24 10:39:56 发布

阅读量10w+

点赞数 14

分类专栏： python python积累文章标签： python cookie requests get

本文链接：https://blog.csdn.net/winterto1990/article/details/51213029

版权

python 同时被 2 个专栏收录

75 篇文章 1 订阅

订阅专栏

python积累

14 篇文章 0 订阅

订阅专栏

哎，好久没有学习爬虫了，现在想要重新拾起来。发现之前学习爬虫有些粗糙，竟然连requests中添加cookies都没有掌握，惭愧。废话不宜多，直接上内容。

我们平时使用requests获取网络内容很简单，几行代码搞定了，例如：

import requests
res=requests.get("https://cloud.flyme.cn/browser/index.jsp")
print res.content</span>

你没有看错，真的只有三行代码。但是简单归简单，问题还是不少的。

首先，这里的请求只是get方法，并且没有解决cookies的问题。

然后就是这里并没有解决乱码的问题。（乱码是python中的变态点）

其实，在requests的get方法中添加cookies的方法不难可以这样子：

res=requests.get("https://cloud.flyme.cn/browser/index.jsp",cookies=cookies)

我们所面临的问题是，如何构造这里的cookies。

这里的cookies是一个字典格式的数据。

平时我们浏览网页的时候，在审查元素中可以查看到所访问网页的cookies内容，大都是这样子的：

sn_openNetBySms=%23810EBMA3TE53; sn_map=810EBMA3TE53; DSESSIONID=f1987887-3d1d-4a85-ad75-c6270e588290; JSESSIONID=; _uid=; _keyLogin=; _rmtk=; _uticket=ns_0393027c2f9f686e3499e8ebb8d1d622; _ckk=ns_397a592791064029bf1336eff1cf516e; ucuid=8a135520affa423584307f6e2c210f02; _domain=cloud.flyme.cn; _islogin=true; lang=zh_CN; JSESSIONID=1gmfzynp0ns6s1u6a92xkqgi6q

天那，这是人看的吗？不是。这是经过加密处理后的数据。同样，我们可以将加密后的数据传递到get方法的cookies参数中，服务器会自动将加密后的数据进行解密，再检查数据的正确性。

至于，如何查看所访问网页的cookies内容，可以使用浏览器的审查功能，F12或者右击审查（Chrome）打开。在network中查看链接的Headers内容。另外，也可以使用软件抓包查看，如Fiddler web Debugger。

这里假设获取到了cookies的内容，我们可以保存到本地TXT文件中（直接把cookies的内容粘贴进去即可），例如test.txt文件。

然后，

f=open(r'test.txt','r')#打开所保存的cookies内容文件
cookies={}#初始化cookies字典变量
for line in f.read().split(';'):   #按照字符：进行划分读取
    #其设置为1就会把字符串拆分成2份
    name,value=line.strip().split('=',1)
    cookies[name]=value  #为字典cookies添加内容

这时候我们将cookies添加到get方法中：

res=requests.get("https://cloud.flyme.cn/browser/index.jsp",cookies=cookies)

这时候获取到的res.content中就是我们将cookies信息添加到get中后访问网页所获取的内容。

使用requests进行网页请求的时候经常会出现中文乱码的问题，可以查看博客内容解决。

有关requests的使用代理问题的解决可以查看博客内容。

Winterto1990

关注

14
点赞
踩
55

收藏

觉得还不错? 一键收藏
6
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录