自学爬虫的初体验(二)

4、Cookies
先看看百度百科上对于Cookies的解释
挺多挺晦涩的,我个人理解了一下:
①Cookies是存储在本地的文本文件。
②Cookies的存在是有期限的。
③Cookies不太安全,不会存储一些隐私信息。
打个比方,在CSDN中进行登录之后,关掉网页,再次打开,你无需再次输入账号密码登录,便回到上次关闭网页的登陆状态。当然,若是很久没有输入相关信息确保用户身份,相关Cookies文件便会失效,这个时候就需要重新登录、验证用户身份。当然账号密码之类的并不会保存在Cookies中,Cookies只会保存你的一些不那么重要的信息,例如你的登录状态等,更重要的东西都保存在Session中。

5、Session
也看看百度百科上对于Session的解释
相比于Cookies,没那么常见,我的理解也比较浅显:
①Session是存储在服务器端的。
②因此Session相比Cookies更加安全。
③Session往往于Cookies共同记录用户的相关信息,不过Session一般保存较为隐私的信息。
在登录之后,本地保存的Cookies会包含一个SessionID,用来于Session中的信息对应,确保服务器中的那一个Session中的信息确实是该用户的信息。

6、爬虫过程中传递Cookies
(较为隐私的部位:url与cookie我都省去了)

url='https://'###此处的网站可以选择一个登录之后的个人主页

headers={
    'user-agent': 'Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/535.1 (KHTML, like Gecko) Chrome/14.0.835.163 Safari/535.1',
    'cookie':''###这里在网站检查页中找到访问网站传递的Cookies,复制过来
}
res=requests.get(url,headers)
html=res.content.decode('UTF-8')
print(html)

这样就能发现在控制台中打印出来的内容包含了我在这个网站的信息
在这里插入图片描述

7、爬虫获取Cookies
因为手动复制Cookies再进行粘贴不够智能,可以调用Session()函数可以做到记录cookie并且携带cookie发起请求。
这里我日后学习了再来补充。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值