请求数据包、返回数据包和代理服务器
Request 请求数据包
Response 返回数据包
Proxy 代理服务器
http和https
超文本传输协议HTTP协议被用于在Web浏览器和网站服务器之间传递信息,HTTP协议以明文方式发送内容,不提供任何方式的数据加密,如果攻击者截取了Web浏览器和网站服务器之间的传输报文,就可以直接读懂其中的信息,因此,HTTP协议不适合传输一些敏感信息,比如:信用卡号、密码等支付信息。
为了解决HTTP协议的这一缺陷,需要使用另一种协议:安全套接字层超文本传输协议HTTPS,为了数据传输的安全,HTTPS在HTTP的基础上加入了SSL协议,SSL依靠证书来验证服务器的身份,并为浏览器和服务器之间的通信加密。
HTTP简要通信过程
建立连接—>发送请求数据包—>返回响应数据包—>关闭连接
1.浏览器建立与Web服务器之间的连接
2.浏览器将请求数据包打包(生成请求数据包)并发送到Web服务器
3.Web服务器将处理结果打包(生成响应数据包)并发送给浏览器
4.Web服务器关闭连接
HTTPS简要通信过程:
Request请求数据包数据格式:
1.请求行:请求类型/请求资源路径、协议的版本和类型(请求行由三个标记组成:请求方法、请求URL和HTTP版本,用空格分隔)
2.请求头:一些键值对,浏览器与Web服务器之间都可以发送,特定的某种含义
3.空行:请求头与请求体之间用一个空行隔开
4.请求体:要发送的数据(一般post提交会使用)
HTTP规划定义了八种可能的请求方法:
GET:检索URL中标识资源的一个简单请求
HEAD:与GET方法相同,服务器只返回状态行和头标,并不返回请求文档
POST:服务器接受被写入客户端输出流中的数据的请求
PUT:服务器保存请求数据作为指定URL新内容的请求
DELETE:服务器删除URL中命令的资源的请求
OPTIONS:关于服务器支持的请求方法信息的请求
TRACE:Web服务器反馈HTTP请求和其头标的请求
CONNECT:已文档化,但当前未实现的一个方法,预留作隧道处理
请求头:
HOST:主机或域名地址
Accept:指浏览器或其他客户可以接受的MIME文件格式。Servlet可以根据它判断并返回适当的文件格式
User-Agent:是客户浏览器名称
Host:对应网址URL中的web名称和端口号
Accept-Langeuage:指出浏览器可以接受的语言种类,如en或en-us,指英语
connection:用来告诉服务器是否可以维持固定的HTTP连接。http是无连接的。HTTP/1.1使用Keep-Alive为默认值,这样,当浏览器需要多个文件时(比如一个HTML文件和相关的图形文件),不需要每次都建立连接
Cookie:浏览器用这个属性向服务器发送Cookie。Cookie是在浏览器中寄存的小型数据体,它可以记载和服务器相关的用户信息,也可以用来实现会话功能
Referer:表明产生请求的网页URL。可以用来跟踪web请求是从什么网站来的
Content-Type:用来表明request的内容类型,可以用HttpServletRequest的getContentType()方法得到
Accept-Charset:指出浏览器可以接受的字符编码,英文浏览器的默认值是ISO-8859-1
Accept-Encoding:指出浏览器可以接受的编码方式。编码方式不同于文件格式,它是为了压缩文件并加速文件传递速度。浏览器在接收到web响应之后先解码,然后再检查文件格式
空行:
最后一个请求头标之后是空行,发送回车符和退行,通知服务器以下不再有头标
请求数据:
使用POST传送,最常使用的是Content-Type和Content-Length头标
GET /a/259865872_570063 HTTP/1.1
Host: www.sohu.com
User-Agent: Mozilla/5.0 (X11; Linux x86_64; rv:78.0) Gecko/20100101 Firefox/78.0
Accept: text/html,application/xhtml+xml,application/xml;q=0.9,image/webp,/;q=0.8
Accept-Language: en-US,en;q=0.5
Accept-Encoding: gzip, deflate
Connection: close
Upgrade-Insecure-Requests: 1
Response请求数据包数据格式
状态行:协议版本、数字形式的状态代码和状态描述,各元素之间以空格分隔
响应头标:包含服务器类型、日期、长度、内容类型等
空行:响应头与响应体之间用空行隔开
响应数据:浏览器会将实体内容中的数据取出来,生成相应的页面
HTTP响应码:
1xx:信息,请求收到,继续处理
2xx:成功,行为被成功地接收、理解和采纳
3xx:重定向,为了完成请求,必须进一步执行的动作
4xx:客户端错误
5xx:服务器错误
200 存在文件
403 存在文件夹
3xx 均可能存在
404 不存在文件及文件夹
500 均可能存在
响应头标:
指出服务器的功能,标识出响应数据的细节
空行:
最后一个响应头标之后是一个空行,发送回车符和退行,表明服务器以下不再有头标
响应数据:
HTML文档和图像等,也就是HTML本身
HTTP/1.1 307 Temporary Redirect
Content-Type: text/html
Content-Length: 180
Connection: close
Server: nginx
Date: Fri, 25 Feb 2022 09:58:05 GMT
Location: https://www.sohu.com/a/259865872_570063
FSS-Cache: from 8212655.14766265.9212435
FSS-Proxy: Powered by 3100769.4542571.4100471