cookie
cookie是什么有什么作用?
http请求是无状态的请求协议,不会记住用户的状态和信息,也不清楚在此之前我们访问过什么,因此网站需要记录用户是否登录时,就需要在用户登录后创建一些信息,并且要把这些信息记录在当前用户的浏览器中,这些记录的内容就是cookie。当用户使用这个浏览器继续访问这个服务器时,会主动携带这个网站设置的cookie的信息,这时就可以直接访问了。
举个例子:我要进入自己博客的这个界面。
可想而知在为登录的情况下是不可能进入成功的。
编写代码:
import requests
#定义请求的url
url='https://blog.csdn.net/qq_44862120/category_9781001.html'
#定义请求头信息
headers={
'User-Agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/81.0.4044.113 Safari/537.36'
'cookie':'这个就不展示了!'
}
result=requests.get(url,headers=headers)
with open('mycsdn.html','w',encoding='utf-8') as f:
f.write(result.text)
运行结果: Process finished with exit code 0
这里会在目录下出现mycsdn.html这样一个HTML文件。打开之后就会进入上述的页面。
session
浏览器在更换或者删除cookie后,信息会丢失,cookie在浏览器中记录的信息不安全,不能记录敏感信息。这时就需要session。
session是在服务器端进行的数据的记录,并且会给每一个用户生成一个sessionID并把这个ID设置在用户的浏览器当中。
更多信息参考这位大佬的博客:小白学爬虫(三)-- requests库之Cookie