爬虫笔记-Session和Cookies

最新推荐文章于 2023-06-09 18:02:29 发布

雍飞宇

最新推荐文章于 2023-06-09 18:02:29 发布

阅读量263

点赞数

分类专栏：爬虫

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qinglianchen0851/article/details/89397888

版权

爬虫专栏收录该内容

9 篇文章 0 订阅

订阅专栏

1、静态网页和动态网页

静态网页：网页的内容是 HTML 代码编写的，文字、图片等内容均是通过写好的 HTML 代码来指定的，这种页面叫做静态网页。优点是访问速度快，缺点点可维护性差
动态网页：动态解析 URL 中参数的变化，关联数据库并动态通过xml、ajax等呈现不同的页面内容。

2、无状态HTTP

HTTP 的无状态是指 HTTP 协议对事务处理是没有记忆能力的，也就是说服务器不知道客户端是什么状态。

即客户端访问服务器，都是需要重新发送信息。

这时候，两个用于保持 HTTP 连接状态的技术就出现了，它们分别是 Session 和 Cookies。

Session 在服务端，也就是网站的服务器，用来保存用户的会话信息。
Cookies 在客户端，也可以理解为浏览器端。

有了 Cookies，浏览器在下次访问网页时会自动附带上它发送给服务器，服务器通过识别 Cookies 并鉴定出是哪个用户，然后再判断用户是否是登录状态，然后返回对应的 Response。

所以我们可以理解为 Cookies 里面保存了登录的凭证，有了它我们只需要在下次请求携带 Cookies 发送 Request 而不必重新输入用户名、密码等信息重新登录了。
因此在爬虫中，有时候处理需要登录才能访问的页面时，我们一般会直接将登录成功后获取的 Cookies 放在 Request Headers 里面直接请求，而不必重新模拟登录。

下面例子是使用IT桔子的例子，调用登陆接口，从而生成tookencookies。
-w1239
-w1255

-w1434

github地址：https://github.com/Haley123/Python3_ITjuziSpider

在这里插入图片描述

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
爬虫笔记-Session和Cookies

1、静态网页和动态网页静态网页：网页的内容是 HTML 代码编写的，文字、图片等内容均是通过写好的 HTML 代码来指定的，这种页面叫做静态网页。优点是访问速度快，缺点点可维护性差动态网页：动态解析 URL 中参数的变化，关联数据库并动态通过xml、ajax等呈现不同的页面内容。2、无状态HTTPHTTP 的无状态是指 HTTP 协议对事务处理是没有记忆能力的，也就是说服务器不知道客户端是...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。