http工作原理

最新推荐文章于 2024-08-18 11:58:40 发布

卢邻

最新推荐文章于 2024-08-18 11:58:40 发布

阅读量50

点赞数

文章标签： http 网络协议网络

本文链接：https://blog.csdn.net/u013951056/article/details/132404047

版权

http

http响应图

关于http响应图的说明

Redirect: 输入一个地址先进行跳转（理解不透彻）
App Cache缓存：检测浏览器是否已有缓存
DNS：查找域名对应的IP
TCP：经过TCP连接三次握手创建TCP连接
Request：发送http请求的数据包
Response：返回数据

网络协议分层

在这里插入图片描述

低三层

物理层作用是0、1和强弱电流间的转换，也叫数模转换和模数转换
数据链路层作用是格式化数据进行传输
网络层作用是两台计算机之间提供连接和路径选择

传输层(TCP、UDP)

定义协议和端口号。TCP传输数据量大、效率低、稳定。UDP传输数据量小、效率高、不稳定，例如：qq等即时通信软件用的是UDP

应用层（HTTP、FTP）

构建于TCP协议之上
屏蔽数据通信的细节

HTTP发展历史

HTTP/0.9

只有一个命令GET
没有header等描述数据的信息
服务器发送完毕，就关闭TCP

HTTP/1.0

增加了很多命令POST、PUT、DELETE等
增加了status code和header
多字符集支持、多部分发送、权限、缓存等

HTTP/1.1

持久连接

1.0版本一个http请求就创建一个TCP，1.1在一个TCP中可以发送多个http请求

pipeline

一个TCP多个请求，服务端需要按照顺序返回

增加host和其他一些命令
在chrome中并发数一般为6个

也就是说一次性最多创建6个TCP连接，后面的资源就会排队等待这6个通道

HTTP/2.0

所有数据以二进制传输（之前是字符串）
同一个连接发送多个请求，不再需要按照顺序
头信息压缩以及推送等提高效率的功能

TCP三次握手

在这里插入图片描述

SYN（synchronous）是TCP/IP建立连接时使用的握手信号、Seq(Sequence number 序列号)、ACK（Acknowledge number确认号码）

URI、URL、URN

Uniform Resource Identifier，统一资源标识符。只要是能唯一标识互联网上资源的字段就是URI，包含URL和URN

Uniform Resource Locator，统一资源定位符。和URI的区别就是只能用地址进行唯一表示http://user:pass@host.com:80/path?query=string#hash

Uniform Resource Name，永久统一资源定位符
在资源移动后还能找到

HTTP报文

在这里插入图片描述

HTTP Method

get、post、delete、put表示不同的语义的方法。但是具体怎么实现在于开发者自己

HTTP Code

定义服务器对请求的处理结果
各个区间的code有各自的语义

100-199:操作没有执行完成，要继续执行才能返回结果
200-299:操作成功
300-399:需要重定向，用别的方式获取数据
400-499:发送的请求有问题，401表示发送请求没有权限
500-599:服务器错误

一个好的http服务是可以通过code判断结果。目前国内很多网站返回的code只有200或者500，然后再自己定义一个状态码来表示当前的状态，这样是非常不好的

linux命令curl

不止是浏览器可以请求，在客户端是用curl命令也可以请求

curl www.baidu.com

响应头

‘Content-Type’:‘text/plain’

这个属性称为互联网媒体类型，也叫做MIME类型。他用来告诉服务端如何请求数据，告诉客户端如何解析响应的数据，比如显示图片，解析并展示html等。

response.setHeader('Content-Type', 'text/html');

跨域请求 ‘Access-Control-Allow-Origin’:‘http://127.0.0.1:1228’

用来设置是否跨域，如果为*表示允许任一站点访问。也可以指定具体允许访问的一个或几个站点

response.setHeader('Access-Control-Allow-Origin', '*');

CORS预请求

CORS为浏览器和服务器跨域请求机制，预请求是在某些特定的请求过程中会增加预请求。浏览器进行预请求的情况如下：

在跨域请求中人为设置了除 CORS 安全的首部字段集合之外的自定义字段

//客户端代码
fetch('http://127.0.0.1:1227/',{
    method: 'POST',
    headers:{
        'x-test-cors':'123'
    }
})
//服务端代码
response.writeHead(200,{
    'Content-Type':'text/plain',
    'Access-Control-Allow-Origin':'http://127.0.0.1:1228',
    //允许客户端自定义的字段访问，否则预请求报错
    'Access-Control-Allow-Headers':'x-test-cors',
})

在跨域请求中CORS默认允许的方法只有GET、POST、HEAD。除此之外都要进行预请求

//客户端代码
fetch('http://127.0.0.1:1227/',{
    method: 'PUT'
})
//服务端代码
response.writeHead(200,{
    'Content-Type':'text/plain',
    'Access-Control-Allow-Origin':'http://127.0.0.1:1228',
    //在服务端要允许PUT方法，否则预请求报错
    'Access-Control-Allow-Methods':'PUT,DELETE'
})

在跨与请求中对允许的Content-Type也有限制除了下面三个，其他的都要进行预请求

1. text/plain
2. multipart/form-data
3. application/x-www-form-urlencoded

预请求的缓存属性Access-Control-Max-Age

为当前的预请求进行缓存，如果设置为100表示在100s内不用在进行预请求

response.writeHead(200,{
        'Content-Type':'text/plain',
        'Access-Control-Allow-Origin':'http://127.0.0.1:1228',
        'Access-Control-Allow-Headers':'x-test-cors',
        'Access-Control-Allow-Methods':'PUT',
        'Access-Control-Max-Age':100
    })

强制缓存

Cache-Control

可缓存性

public

从服务器到代理服务器到浏览器都可以进行缓存

private

只有发起请求的浏览器可以进行缓存,代理服务器不可以

no-cache

虽然允许在浏览器和代理服务器进行缓存，但必须去服务端进行验证。

到期

max-age = <seconds>

资源缓存在浏览器中，如果不强制刷新，在缓存期内一直使用浏览器缓存。

if(req.url === '/script.js'){
    res.writeHead(200,{
        'Content-Type':'text/javascript',
        'Cache-Control':'max-age=200',
    })
    res.end('console.log("script test five")')
}

在缓存期内如果返回资源变更，返回内容依然使用浏览器缓存。这时候我们就要增加文件版本号，来改变url。重新请求服务器，得到正确的返回值。

res.end('console.log("script test six")')//打印出来的依然是'script test five'

s-maxage = <seconds>

专门针对代理服务器缓存

max-stale = <seconds>

发起请求方带的头，即便max-age 已经过期，还可以是用过期的内容

重新验证

must-revalidate
proxy-revalidate

其他

no-store

和no-cache的区别是，no-cache允许在浏览器和代理服务器进行缓存，但需要去服务端进行验证，no-store彻底禁用缓存，浏览器和代理服务器都不可以缓存。

no-transform

协商缓存

Last-Modified 缓存

给资源设置上次修改时间
配合If-Modified-since和If-UnModified-Since
对比上次修改时间，验证资源是使用缓存还是更新资源

Etag 缓存

数据签名
配合If-Match或者If-None-Match使用
对比资源的签名判断是使用缓存还是更新资源

if(req.url === '/script.js'){
    res.writeHead(200,{
        'Content-Type':'text/javascript',
        //这里增加no-cache原因是禁止使用缓存，但请求必须到达服务端
        'Cache-Control':'max-age=2000000,no-cache',
        'Last-Modified':'lastModified',
        'Etag':'eTag',
    })
}

第一次请求浏览器会在服务器获取资源，第二次请求就会携带If-Modified-since和If-None-Match

需要在服务端进行判断是否存在etag，如果存在返回304，否则返回200

if(req.url === '/script.js'){
    if(req.headers['if-none-match'] === 'eTag'){
        res.writeHead(304,{
            'Content-Type':'text/javascript',
            'Cache-Control':'max-age=2000000,no-cache',
            'Last-Modified':'lastModified',
            'Etag':'eTag',
        })
        res.end('123')
    }else{
        res.writeHead(200,{
            'Content-Type':'text/javascript',
            'Cache-Control':'max-age=2000000,no-cache',
            'Last-Modified':'lastModified',
            'Etag':'eTag',
        })
        res.end('console.log("script test four")')
    }
}

此时浏览器依然返回’console.log(“script test four”)'这是因为状态吗304就表示读取缓存。
如果将上面例子中的no-cache去掉，则又会使用浏览器缓存from memory cache
如果将上面例子中的no-cache替换成no-store，则禁用所有缓存包括浏览器缓存from memory cache及Etag缓存304

cookie

在服务端返回数据时通过Set-Cookie设置，保存在浏览器中，下次在同域请求时就会带上

cookie属性

max-age和expires设置过期时间

max-age表示多长时间后过期，expires表示到什么时间过期

Secure只在https的时候发送
HttpOnly无法通过document.cookie访问

// abc=456在前端页面无法用document.cookie打印
//domain属性用来指定cookie所属域，如果domain=*.test.com表示test.com域名下所有子域都可以访问
res.writeHead(200,{
    'Content-Type':'text/html',
    'Set-Cookie':['id=123;max-age=2','abc=456;HttpOnly','test=678;domain=test.com']
})

长连接

http/1.1和http/2.0 都采用长连接的形式，创建一个TCP，然后对这个TCP进行复用，不同的是http/1.1需要按照顺序同步请求。http/2.0创建的TCP可以同时发送多个http，不需要排队。所以一般http/2.0只开一个TCP连接就够了，极大的降低了资源的损耗。
一般的http默认开启长链接，当然也可以关闭长链接，如果关闭，则一个http对应一个TCP。这样将及其耗费资源，形式如下：

res.writeHead(200, {
    'Content-Type': 'image/jpg',
    'Connection': 'close', // 默认值keep-alive不用设置
})

数据协商

客户端发送的参数

指定客户端要的数据类型

Accept-Encoding

代表数据以怎样的编码方式进行传输，限制服务端进行怎样的数据压缩，目前比较流行的是gzip, deflate, br

Accept-Language

希望返回的语言

User-Agent

用来表示浏览器的信息

multipart/form-data

 <form id="form" action="/form" enctype="multipart/form-data" method="POST">
        <input type="text" name="name">
        <input type="password" name="password">
        <input type="file" name="file">
        <input type="submit" >
    </form>

如果表单中有文件上传，则必须将enctype设为multipart/form-data，上传过程中文件会单独根据上传的文件类型自动设置Content-Type的值，例如：上传了一个图片，Content-Type为image/png，下面为上传过程中部分代码：

------WebKitFormBoundarynDJyBfdkoW3jXfzx
Content-Disposition: form-data; name="file"; filename="QQ20190618-141034@2x.png"
Content-Type: image/png

服务端返回的参数Content

Content-Type

对应Accept，表示实际返回的数据类型

Content-Encoding

对应Accept-Encoding，服务端具体用了怎样的压缩方式，目前比较流行的是gzip, deflate, br
开启gzip压缩之后，chrome浏览器network中的Size会减小，就表明压缩了。下面的灰色字节表示解压之后的大小（包括头信息，所以有时会比Size要大），和是否进行gzip压缩没有关系。

Content-Language

对应Accept-Language，表示实际以什么语言返回

重定向

重定向就是访问地址A，转而访问地址B

// 当浏览器访问服务器http://www.tianlei.com会自动转向访问地址http://www.tianlei.com/new
if(req.url === '/'){
    res.writeHead(301,{
        "Location":"/new"
    })
    res.end()
}
if(req.url === '/new'){
    res.writeHead(200,{
        "Content-Type":"text/plain"
    })
    res.end('Hello World\n')
}