爬虫中cookie和session的区别
cookie和session的区别
1.存储位置不同:
1)cookie存在本地浏览器。
2)session存储在服务器上。
2.存储容量不同:
1)每一个cookie保存的数据小于等于4kb,而且一个站点最多保存20个cookie。
2)session设置容量没有上限,但是session存在服务器上,出于对服务器性能的考虑,session不会存放太多的东西。
3.安全性不同:
1)cookie对于客户端来说是可见的,可能有一些坏蛋分子对存在本地的cookie进行cookie欺骗,所以,cookie是不安全的。
2)session是存在服务器的,对于客户端来说是透明的,不存在敏感信息泄露的风险。
4.服务器的压力不同:
1)cookie不会占用服务器资源,对于并发量多的网站,cookie就会是一个很好的选择。
2)session保存在服务器,每个用户都会产生session,如果并发量很多的网站,用户就会产生很多session,消耗大量的内存。
5.浏览器支持不同:
1)如果浏览器不支持cookie:
cookie是需要客户端的浏览器支持的,session需要使用URL重写技术。
2)如果浏览器支持cookie:
cookie既能设置成本窗口以及子窗口,也可以设置成所有窗口有效。
session只能够在本窗口以及子窗口有效。
6.跨域支持不同:
1)cookie支持跨域名访问。
2)session不支持跨域名访问。
案例
cookie开心网案例
# 1.导入requests
import requests
# 定义登录成功后访问的URL
base_url = 'http://www.kaixin001.com/set/wap.php'
# 定义请求头
headers = {
'Cookie':登录成功后的Cookie信息,
'User-Agent': 浏览器的User-Agent(建议使用谷歌浏览器)
}
# 2.发起请求,接收响应
response = requests.get(url=base_url, headers=headers)
# 3.保存文件
with open('kaixin_cookie.html', 'w', encoding='utf8') as fp:
fp.write(response.text)
session开心网案例
# 1.导入requests
import requests
# 2.使用requests生成一个session对象
ssion = requests.session()
# 定义参数(form表单中的action)
login_url = 'https://security.kaixin001.com/login/login_post.php'
# 模拟用户登录(input框中的name属性)
data = {
'loginemail':'用户名',
'password':'密码'
}
headers = {
'User-Agent':谷歌浏览器的User-Agent
}
# 3.使用seeion对像发起请求,接收响应
response = ssion.post(url=login_url, data=data, headers=headers)
# 4.保存文件
with open('kaixin_session.html', 'w', encoding='utf8') as fp:
fp.write(response.text)