http和https协议

HTTP和HTTPS复习内容
内容概述
HTTP和HTTPS概述
HTTP的请求过程
HTTP的请求形式
HTTP的常见请求头
GET和POST
响应状态码
URL
URL: 统一资源定位符是对可以从互联网上得到的资源的位置和访问方法的一种简洁的表示,是互联网上标准资源的地址

URL的格式

格式: scheme://host[:port#]/path/…/[?query-string][#anchor]
scheme:协议(例如:http, https, ftp)
host:服务器的IP地址或者域名
port:服务器的端口(如果是走协议默认端口,80[http]or443[https]可以省略)
path:访问资源的路径
query-string:参数,发送给http服务器的数据
anchor:锚(跳转到网页的指定锚点位置)
http://item.jd.com/11993134.html#detail
浏览器发送HTTP请求的过程
在这里插入图片描述
注意:
浏览器渲染出来的页面和爬虫请求的页面 并不完全一样
原因: 因为浏览器在进行渲染时候, 会自动加载css,js,图片等数据.
HTTP和HTTPS概述
HTTP和HTTPS在爬虫中的位置
在这里插入图片描述
HTTP概述

HTTP

超文本传输协议
默认端口号:80
在这里插入图片描述
HTTPS

HTTP + SSL(安全套接字层)
默认端口号:443
在这里插入图片描述
对比:

HTTPS比HTTP更安全,但是性能更低

HTTP请求报文的格式
在这里插入图片描述
问题:GET方法和POST方法有什么区别呢?

Get方法

用来获取服务器的资源
在url中传输获取数据的参数信息
传输的数据量小(2KB-7KB)
Post方法

用来把数据传输给服务器(本质上更专业)
在请求体中传输给数据的数据
传输的数据量大(HTTP协议没有限制)

HTTP常见请求头
Host: 主机和端口号
Connection: 链接类型
Upgrade-Insercure-Requests(升级为HTTPS的请求)
测试: http://www.baidu.com
User-Agent: 浏览器名称(重点)
Accept: 接收的文件类型
Referer: 从哪个页面跳转过来的, 用于做防盗链
Accept-Encoding: 接收文件的压缩格式
Cookie: Cookie
X-Requested-With: XMLHttpRequest 是Ajax异步请求

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值