HTTP协议基础

HTTP简介

超文本传输协议(HTTP,HyperText Transfer Protocol)是互联网上应用最为广泛的一种网络协议。所有的www文件都必须遵守这个标准。设计HTTP最初的目的是为了提供一种发布和接收HTML页面的方法。HTTP协议在网络OSI模型中属于应用层协议,应用层协议除了HTTP 还有:FTP,SMTP,DNS,RIP,Telnet等。

HTTP协议工作于客户端-服务端架构上。浏览器作为HTTP客户端通过URL向HTTP服务端(web服务器)发送请求。

超文本

超文本英文名:Hypertext,我们在浏览器里面看到的网页就是超文本解析而成的,其网页源代码是一系列HTML代码,里面包含了一系列标签,如img显示图片,p指定显示段落等,浏览器解析这些标签后便形成我们平常看到的网页,而这网页的源代码HTML就可以称作超文本。

例如:我们在Chrome浏览器里面打开百度页面,点击右键“查看源代码”,这些源代码就是超本。

URL

我们在浏览器地址栏中输入网站地址叫做URL(Uniform Resource Locator, 统一资源定位符),每个网页有一个Internet地址(如:http://www.51zxw.net).当你在浏览器的地址框中输入一个url或是单击一个超链接时,url就确定了要浏览的地址,浏览器通过超文本传输协议(HTTP),将web服务器上站点的网页代码提取出来,并翻译成漂亮的网页。

HTTP功能

HTTP协议(HyperText  Transfer Protocol,超文本传输协议)是用于从服务器传输超文本到本地浏览器的传输协议。它可以使浏览器更加高效,使网络传输减少。它不仅保证计算机正确快速地传输超文本文档,还确定传输文档中的哪一部分,以及哪部分内容首先显示(如文本先于图形)等。

HTTP特点

  • 无连接:无连接的含义是限制每次连接只处理一个请求。服务器处理完客户的请求,并收到客户的应答后,即断开连接,采用这种方式可以节省传输时间。
  •  媒体独立:这意味着,只要客户端和服务端知道如何处理的处理的数据内容,任何类型的数据都可以通过HTTP发送。客户端以及服务端指定使用适合的MIME-type来传输。
  • 无状态:HTTP协议是无协议状态,无协议是指协议对于事物处理没有记忆能力,如果服务器不需要先前信息,那么它的应答就比较快,但是缺少状态意味看如果后续处理需要前面的信息,则它必须重传,这样可能导致每次连接传送的数据量增大,此时可以设置缓存。

HTTP 与HTTPS

HTTPS的全称是HyperText Transfer Protocol over Secure SocketLayer,是以安全为目标的HTTP通道,简单讲是HTTP的安全版,即HTTP下加入SSL层(Secure Sockets Layer 安全套接层),简称为HTTPS,S是Security单词的首字母。

HTTPS的安全基础是SSL,因此通过它传输的内容都是SSL加密的,它的主要作用可以分为两种:

1:建议一个信息安全通道,来保证数据传输的安全。

2:确认网络的真实性,凡是使用了https的网站,都可以通过点击浏览器地址栏的锁头标志来查看网站认证之后的真实信息,也可以通过CA机构颁发的安全签章来查询。

现在的趋势是向HTTPS方向发展的,谷歌从2017年推出Chrome56开始,对未进行HTTPS加密的网站链接亮出风险提示,即在地址栏的显著位置提醒用户“此网页不安全”。

HTTP与TCP/IP的区别

TCP/IP 协议是传输层协议主要解决数据如何在网络中传输而HTTP是应用层协议主要解决如何包装数据。关于TCP/IP与HTTP协议的关系:我们在传输数据时,可以只使用(传输层)TCP/IP协议,但是如果没有应用层,便无法识别数据内容,如果想要使传输的数据有意义,则必须使用到应用层协议,应用层协议有很多,如HTTP,FTP,TELNET等,也可以自己定义应用层协议。WEB使用HTTP协议作应用层协议,以封装HTTP文本信息,然后使用TCP/IP做传输层协议将他发到网络上。

HTTP请求的过程

我们在浏览器输入百度首页的地址:https://www.baidu.com/ 输入之后浏览器会给我们打开百度首页,实际上这个过程是浏览器向网站所在的服务器发送了一个Request,即请求,网站服务器接收到这个Request之后进行处理和解析,然后返回对应的一个Response,即响应,然后传回给浏览器, Response里面就包含了页面的源代码等内容,浏览器再对其进行解析便将网页呈现出来。

浏览器F12:

Request ,即请求,由客户端向服务端发出,可以将Request划分为四部分内容。

  • Request Method :请求方式
  • Request URL:请求连接,即统一资源定位符
  • Request Headers:请求头,用来说明服务器要使用的附件信息,比较重要的信息有cookie,referer,user-agent等,下面是一些常用的信息说明:
  1. Accept:请求报头域,用于指定客户端可接受哪些类型的信息。
  2. Accept-Language:指定客户端可接受的语言类型。
  3. Accept-Encoding:指定客户端可即接受的内容编码。
  4. Host:用于指定请求资源的主机IP,和端口号,其内容为请求url的原始服务器或网关的位置,从HTTP1.1版本开始,Request必须包含此内容。
  5. Cookie:常用的复数形式Cookies,是网站为了辨别用户进行Session跟踪而储存在用户本地的数据,Cookies的主要功能是维持当前访问会话。
  6. Referer:此内容用来标识这个请求是从哪个页面发过来的,服务器可以拿到这一信息并做相应的处理,如来源统计,做防盗链处理等。
  7. User-Agent:简称UA,它是特殊字符串头,使得服务器能够识别客户使用的操作系统与版本,浏览器以及版本信息,在做爬虫时加上此信息可以伪装为浏览器,如果不加很容易被识别出爬虫。
  8. Content-Type:即Internet Media Type,互联网媒体类型,也叫做MIME类型,在HTTP协议消息头中,是用来表示具体请求中的媒体类信息,如:application/x-www-form-urlencoded表示表单数据,text/html代表HTML格式,image/gif 代表GIF图片,application/json 代表json类型
  • Request Body: 请求体,一般用于post请求中,主要定义向服务器提交的数据类型,如果是get请求,Request Body则为空。

Request Method请求方式,请求方式常见的有两种类型:get 和post。

  • get 用于信息获取,而且应该是安全的和幂等的(幂等的的意思是一个操作不会修改状态信息,并且每次操作的时候都返回同样的结果)从发送请求的角度,get请求相当于我们在数据库中做了查询的操作,这样的操作不影响数据库本身的数据。
  • post 表示可能会修改服务器上资源的请求,也相当于在数据库中做了修改的操作,会影响数据库本身的数据(比如:注册账号,修改密码,新增某一个功能数据)

get 与post 的区别:

  • GET请求的数据会附在URL之后(就是把数据放置在HTTP协议头中),以?分割URL和传输数据,参数之间以&相连;POST把提交的数据则放置在是HTTP包的包体中。
  • POST的安全性要比GET的安全性高,比如:通过GET提交数据,用户名和密码将明文出现在URL上,因为(1)登录页面有可能被浏览器缓存,(2)其他人查看浏览器的历史纪录,那么别人就可以拿到你的账号和密码了

目前的一些请求方式有:

目前主要是前面5种类型在实际应用中比较多

Response: 即响应,由服务器返回给客户端,一般划分为三部分:

  • Response Status Code
  • Response Headers
  • Response Body

Response Status Code: 响应状态码,此状态表示服务器的相应状态,如下图表示常见状态码:

Response Headers:

Response Body:即响应体,响应的正文数据都是在响应体中,如请求一个网页,它的响应体是网页的HTML代码,请求一张图片,它的响应体是图片的二进制数据。一般在接口响应的内容多数是Json数据内容。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值