〇、引入
http的默认端口是80,而一些服务器例如tomcat常用8080作为默认端口。
客户端通过发送请求向服务端请求资源,服务端收到客户请求之后,对其内容进行解析并向客户端回送一个响应,这就是一个http协议用于客户端和服务器端通信的一般过程。
一、http请求
HTTP定义了与服务器交互的不同方法,最基本的方法有4种,分别是GET,POST,PUT,DELETE。URL全称是资源描述符,我们可以这样认为:一个URL地址,它用于描述一个网络上的资源,而 HTTP 中的GET,POST,PUT,DELETE就对应着对这个资源的查,改,增,删4个操作。
GET用于信息获取,而且应该是安全的 和幂等的。
所谓安全的意味着该操作用于获取信息而非修改信息。换句话说,GET 请求一般不应产生副作用。就是说,它仅仅是获取资源信息,就像数据库查询一样,不会修改,增加数据,不会影响资源的状态。
幂等的意味着对同一URL的多个请求应该返回同样的结果。
1.1、GET请求报文示例:
GET /books/?sex=man&name=Professional HTTP/1.1
Host: www.example.com
User-Agent: Mozilla/5.0 (Windows; U; Windows NT 5.1; en-US; rv:1.7.6)
Gecko/20050225 Firefox/1.0.1
Connection: Keep-Alive
1.2、POST表示可能修改变服务器上的资源的请求:
POST / HTTP/1.1
Host: www.example.com
User-Agent: Mozilla/5.0 (Windows; U; Windows NT 5.1; en-US; rv:1.7.6)
Gecko/20050225 Firefox/1.0.1
Content-Type: application/x-www-form-urlencoded
Content-Length: 40
Connection: Keep-Alive
sex=man&name=Professional
1.3、注意:
GET可提交的数据量受到URL长度的限制,HTTP协议规范没有对URL长度进行限制。这个限制是特定的浏览器及服务器对它的限制。理论上讲,POST是没有大小限制的,HTTP协议规范也没有进行大小限制,出于安全考虑,服务器软件在实现时会做一定限制。参考上面的报文示例,可以发现GET和POST数据内容是一模一样的,只是位置不同,一个在URL里,一个在HTTP包的包体里
1.4、http请求,一般由如下部分组成:
1.请求行
2.请求头(HTTP首部字段 )
3.\r\n (CR+LF)
4.报文主体
二、http响应
2.1、HTTP 响应组成
与 HTTP 请求相似,HTTP响应也由3个部分构成,分别是:
状态行
响应头(Response Header)
响应正文
状态行由:
协议版本
数字形式的状态代码
相应的状态描述
组成,各元素之间以空格分隔。
2.2、常见的状态码有如下几种:
200 OK 客户端请求成功
301 Moved Permanently 请求永久重定向
302 Moved Temporarily 请求临时重定向
304 Not Modified 文件未修改,可以直接使用缓存的文件
400 Bad Request 由于客户端请求有语法错误,不能被服务器所理解
401 Unauthorized 请求未经授权。这个状态代码必须和WWW-Authenticate报头域一起使用
403 Forbidden 服务器收到请求,但是拒绝提供服务。服务器通常会在响应正文中给出不提供服务的原因
404 Not Found 请求的资源不存在,例如,输入了错误的URL
500 Internal Server Error 服务器发生不可预期的错误,导致无法完成客户端的请求。
503 Service Unavailable 服务器当前不能够处理客户端的请求,在一段时间之后,服务器可能会恢复正常。
概括起来:
2XX:成功。表示请求已经被成功接收、理解、接受。
3XX:重定向。要完成请求必须进行更进一步的操作。
4XX:客户端错误,请求有语法错误或请求无法实现。
5XX:服务器端错误,服务器未能实现合法的请求。
2.3、一个HTTP响应的例子:
< HTTP/1.1 200 OK
< Server: bfe/1.0.8.18
< Date: Sun, 11 Dec 2016 10:51:49 GMT
< Content-Type: text/html
< Content-Length: 2381
< Last-Modified: Mon, 25 Jul 2016 11:11:39 GMT
< Connection: Keep-Alive
< ETag: "5795f3eb-94d"
< Cache-Control: private, no-cache, no-store, proxy-revalidate, no-transform
< Pragma: no-cache
< Set-Cookie: BDORZ=27315; max-age=86400; domain=.baidu.com; path=/
< Accept-Ranges: bytes
<!DOCTYPE html>...
三、HTTP首部字段
首部字段根据用途被分为:
通用首部字段:请求和响应报文都会用到。
请求首部字段:客户端向服务端发送请求报文时使用的首部。
响应首部字段:从服务端向客户端返回响应时使用的首部。
实体首部字段:针对请求报文和响应报文的实体部分使用的首部。
3.1、Content-Type字段(响应)
服务器回应的时候,必须告诉客户端,数据是什么格式,这就是Content-Type字段的作用。
text/plain
text/html
text/css
image/jpeg
image/png
image/svg+xml
audio/mp4
video/mp4
application/javascript
application/pdf
application/zip
application/atom+xml
这些数据类型总称为MIME type,每个值包括一级类型和二级类型,之间用斜杠分隔。
除了预定义的类型,厂商也可以自定义类型。
application/vnd.debian.binary-package
上面的类型表明,发送的是Debian系统的二进制数据包。
MIME type还可以在尾部使用分号,添加参数。
Content-Type: text/html; charset=utf-8
上面的类型表明,发送的是网页,而且编码是UTF-8。
客户端请求的时候,可以使用Accept字段声明自己可以接受哪些数据格式。
Accept: */*
上面代码中,客户端声明自己可以接受任何格式的数据。
3.2、Connection字段
该字段一般两个值keep-alive和close
HTTP是无状态的 。
也就是说,浏览器和服务器每进行一次HTTP操作,就建立一次连接,但任务结束就中断连接。如果客户端浏览器访问的某个HTML或其他类型的Web页中包含有其他的Web资源,如JavaScript文件、图像文件、CSS文件等;当浏览器每遇到这样一个Web资源,就会建立一个HTTP会话
HTTP1.1和HTTP1.0相比较而言,最大的区别就是增加了持久连接支持(貌似最新的 http1.0 可以显示的指定 keep-alive),但还是无状态的,或者说是不可以信任的。
如果浏览器或者服务器在其头信息加入了这行代码
Connection:keep-alive
TCP连接在发送后将仍然保持打开状态,于是,浏览器可以继续通过相同的连接发送请求。保持连接节省了为每个请求建立新连接所需的时间,还节约了带宽。
四、总结
本文学习了http协议的基本概念,这是编写http server的基础,尤其是http报文头部的内容,是服务端解析请求并回送响应的基础。