python爬虫模拟扫码登录_Python爬虫基础-模拟登陆

本文介绍了Python爬虫模拟登录的两种方法:通过Cookie和使用Session。详细讲述了Cookie的工作原理和HTTP持久连接的重要性,并提供了使用requests库模拟登录知乎的代码示例。然而,作者在实践中发现仅凭Cookie可能无法保持登录状态,提示需要进一步处理或考虑使用Session。
摘要由CSDN通过智能技术生成

为什么我们要让爬虫模拟登陆呢?

有些内容只有登陆才能进行爬取,如知乎,不登录的主页只能看到注册和登陆 ;

你想爬取自己的个人信息

有什么方法呢?

cookie

在互联网发展的早期,由于大家的服务器都不是太好,所以服务端不会记住你的个人信息,这会增加服务器的压力。因此早期的连接都是一次性的,服务器在不会记得你什么时候来过,也不知道你做了什么。但是随着服务器的升级换代,淘宝这类网站需要记住你的个人信息,这样你下次访问的时候可以继续上次的工作。但是http协议依旧保持了无状态的特性,cookies应运而生。cookies在访问服务器后会记录在浏览器上,这样就可以在客户端下次访问的时候想起它是谁了。

HTTP持久连接

在没有持久连接之前,为获取每一个URL指定的资源都必须建立一个独立额TCP连接,一方面加重了HTTP服务器的负担;另一方面由于服务器不会记住客服端,导致我们需要每一个请求都要执行登录操作。但是有了HTTP持久连接后,我们对同一个主机的多次请求会使用同一个TCP连接。因此登录后就可以保持这类状态进行请求操作。

实现方法!

针对方法1,我们只要从在浏览器获取cookie,然后带着cookie进行访问就行了,如下:

利用chrome的开发者工具获取cookies

d5c67999288f

获取cookies

填写cookies cookies = {'cookie':'红框部分

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值