4、Cookies
先看看百度百科上对于Cookies的解释
挺多挺晦涩的,我个人理解了一下:
①Cookies是存储在本地的文本文件。
②Cookies的存在是有期限的。
③Cookies不太安全,不会存储一些隐私信息。
打个比方,在CSDN中进行登录之后,关掉网页,再次打开,你无需再次输入账号密码登录,便回到上次关闭网页的登陆状态。当然,若是很久没有输入相关信息确保用户身份,相关Cookies文件便会失效,这个时候就需要重新登录、验证用户身份。当然账号密码之类的并不会保存在Cookies中,Cookies只会保存你的一些不那么重要的信息,例如你的登录状态等,更重要的东西都保存在Session中。
5、Session
也看看百度百科上对于Session的解释
相比于Cookies,没那么常见,我的理解也比较浅显:
①Session是存储在服务器端的。
②因此Session相比Cookies更加安全。
③Session往往于Cookies共同记录用户的相关信息,不过Session一般保存较为隐私的信息。
在登录之后,本地保存的Cookies会包含一个SessionID,用来于Session中的信息对应,确保服务器中的那一个Session中的信息确实是该用户的信息。
6、爬虫过程中传递Cookies
(较为隐私的部位:url与cookie我都省去了)
url='https://'###此处的网站可以选择一个登录之后的个人主页
headers={
'user-agent': 'Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/535.1 (KHTML, like Gecko) Chrome/14.0.835.163 Safari/535.1',
'cookie':''###这里在网站检查页中找到访问网站传递的Cookies,复制过来
}
res=requests.get(url,headers)
html=res.content.decode('UTF-8')
print(html)
这样就能发现在控制台中打印出来的内容包含了我在这个网站的信息
7、爬虫获取Cookies
因为手动复制Cookies再进行粘贴不够智能,可以调用Session()函数可以做到记录cookie并且携带cookie发起请求。
这里我日后学习了再来补充。