计算机网络(1) - 基础:TCP/IP、http

本文深入介绍了计算机网络的基础知识,包括TCP/IP协议族中的TCP和HTTP协议。详细阐述了TCP的三次握手和四次挥手过程,以及HTTP的基本概念、方法区别和状态码。此外,还探讨了TCP长连接、SYN攻击和防御策略以及Socket通信。
摘要由CSDN通过智能技术生成

计算机网络需要知道的东西:

计算机网络体系结构分层 OSI&TCP/IP

在这里插入图片描述

  • OSI 参考模型注重“通信协议必要的功能是什么”,而 TCP/IP 则更强调“在计算机上实现协议应该开发哪种程序”。

  • TCP/IP
    IP 或 ICMP、TCP 或 UDP、TELNET 或 FTP、以及 HTTP 等都属于 TCP/IP 协议。他们与 TCP 或 IP 的关系紧密,是互联网必不可少的组成部分

mac地址和ip地址的区别

1、MAC地址的长度为48位(6个字节);而IP地址为32位。
2、MAC地址应用在OSI第二层,即数据链路层;IP地址应用于OSI第三层,即网络层。
3、MAC地址的分配是基于制造商;IP地址的分配是基于网络拓朴。

端口号
端口号协议
21/tcpFTP 文件传输协议
22/tcpSSH 安全登录、文件传送(SCP)和端口重定向
23/tcpTelnet 不安全的文本传送
25/tcpSMTP Simple Mail Transfer Protocol (E-mail)
69/udpTFTP Trivial File Transfer Protocol
79/tcpfinger Finger
80/tcpHTTP 超文本传送协议 (WWW)
110/tcpPOP3 Post Office Protocol (E-mail)
220/tcpIMAP3
443/tcpHTTPS used for securely transferring web pages

更多


TCP

大写的是标志位,值是1或0;而小写的是序号

序列号seq标记数据段的顺序,占4个字节(32bit)第一个字节的编号由本地随机产生;给字节编上序号后,就给每一个报文段指派一个序号;序列号seq就是这个报文段中的第一个字节的数据编号。
确认号ack期待收到对方下一个报文段的第一个数据字节的序号当前报文段最后一个字节的编号+1即为确认号
标志位,占1bit
确认ACK仅当ACK=1时,确认号字段才有效。ACK=0时,确认号无效
同步SYN连接建立时用于同步序号当SYN=1,ACK=0时表示:这是一个连接请求报文段。
若同意连接,则在响应报文段中使得SYN=1,ACK=1。
SYN这个标志位只有在TCP建产连接时才会被置1,握手完成后SYN标志位被置0
终止FIN用来释放一个连接FIN=1表示:此报文段的发送方的数据已经发送完毕,并要求关闭连接
紧急URG是否紧急为1,表示某一位需要被优先处理

TCP三次握手

进行三次握手的主要作用就是为了确认双方的接收能力和发送能力是否正常,指定自己的初始化序列号为后面的可靠性传送做准备。
(刚开始客户端处于 Closed 的状态,服务端处于 Listen 状态。)

  • 第一次握手客户端给服务端发一个 SYN 报文,并指明初始化序列号ISN(Initial Sequence Number),假设为x,那么发送[ SYN=1,seq=x ], 并进入SYN_SENT状态,等待服务器确认

  • 第二次握手:服务器收到客户端的 SYN 报文之后,会以自己的 SYN+ACK 报文作为应答,并且也是指定了自己的初始化序列号 ISN(s),假设为y。同时会把客户端的 ISN(x) + 1 作为确认号ack 的值,表示自己已经收到了客户端的 SYN,此时服务器处于 SYN_REVD 的状态。回复:[ SYN=1, ACK=1, seq=y, ack=x+1]

  • 第三次握手:客户端向服务器发送一个 ACK 报文(ack=y+1),此时客户端处于 ESTABLISHED 状态。服务器收到 ACK 报文之后,也处于 ESTABLISHED 状态,此时,双方已建立起了连接。establish(建立)。发送:[ ACK=1, seq=x+1, ack=y+1 ]

    事实上,三次握手是保证双方互相明确对方能收能发的最低值,再往上加握手次数不过是提高这个连接的可信程度。世界上不存在完全可靠的通信协议,所以从通信时间成本空间成本以及可靠度来讲,采取三次握手作为点对点的通信一般规则。

    扩展知识点:

    1. 什么是半连接队列?
      服务器第一次收到客户端的 SYN 之后,就会处于 SYN_RCVD 状态,此时双方还没有完全建立其连接,服务器会把此种状态下请求连接放在一个队列里,我们把这种队列称之为半连接队列
      已经完成三次握手,建立起连接的就会放在全连接队列中。
    1. SYN-ACK 重传次数的问题
      服务器发送完SYN-ACK包,如果未收到客户确认包,服务器进行首次重传,等待一段时间仍未收到客户确认包,进行第二次重传。如果重传次数超过系统规定的最大重传次数,系统将该连接信息从半连接队列中删除。
      注意,每次重传等待的时间不一定相同,一般会是指数增长,例如间隔时间为 1s,2s,4s,8s…
    1. SYN攻击是什么?
      SYN攻击就是Client在短时间内伪造大量不存在的IP地址,并向Server不断地发送SYN包,Server则回复确认包,并等待Client确认,由于源地址不存在,因此Server需要不断重发直至超时,这些伪造的SYN包将长时间占用未连接队列,导致正常的SYN请求因为队列满而被丢弃,从而引起网络拥塞甚至系统瘫痪。SYN 攻击是一种典型的 DoS/DDoS 攻击。
      检测 SYN 攻击非常的方便,当你在服务器上看到大量的半连接状态时,特别是源IP地址是随机的,基本上可以断定这是一次SYN攻击。在 Linux/Unix 上可以使用系统自带的 netstats 命令来检测 SYN 攻击。netstat -n -p TCP | grep SYN_RECV
      常见的防御 SYN 攻击的方法有如下几种:
      (1)缩短超时(SYN Timeout)时间
      (2)增加最大半连接数
      (3)过滤网关防护
      (4)SYN cookies技术

TCP四次挥手

  • 第一次挥手客户端发送一个 FIN 报文,报文中会指定一个序列号 u。此时客户端处于 FIN_WAIT1 状态,并停止再发送数据。[ FIN=1,序号seq=u ]

  • 第二次挥手服务端发送 ACK 报文,且把客户端的序列号值 u +1 作为 ack确认号,表明已经收到客户端的报文了,此时服务端处于 CLOSE_WAIT 状态。[ ACK=1, seq = v,ack=u+1 ]

    客户端收到服务端的确认后,进入FIN_WAIT2(终止等待2)状态,等待服务端发出的连接释放报文段。

  • 第三次挥手:如果服务端也想断开连接了,才发 FIN 报文,且指定一个序列号 w。此时服务端处于 LAST_ACK 的状态。[ FIN=1,ACK=1,seq=w,ack=u+1 ]

  • 第四次挥手客户端收到 FIN 之后,一样发送一个 ACK 报文作为应答,且把服务端的序列号值w +1 作为确认号,此时客户端处于 TIME_WAIT 状态。需要过一阵子(2MSL后)以确保服务端收到自己的 ACK 报文之后才会进入 CLOSED 状态,服务端收到 ACK 报文之后,就处于关闭连接了,处于 CLOSED 状态。

    扩展知识点

    1. 2MSL等待状态
      TIME_WAIT状态也成为2MSL等待状态。每个具体TCP实现必须选择一个报文段最大生存时间MSL(Maximum Segment Lifetime)
    2. 四次挥手释放连接时,等待2MSL的意义?
      (1)保证客户端发送的最后一个ACK报文段能够到达服务端。
      (2)防止“已失效的连接请求报文段”出现在本连接中。

TCP & UDP

TCPUDP用户数据报协议
面向连接的无连接的协议(无管道)
一对一 有单播,多播,广播的功能
面向字节流的 基于数据报的
保证数据正确性 可能丢包,不能传大容量数据
保证数据顺序
应用
文件传输、接受邮件、远程登录。效率要求相对高,对准确性要求相对低的场景。举几个例子:QQ聊天、在线视频、网络语音电话

http

资料:HTTP 协议 · 笔试面试知识整理
http协议是无状态的,无连接的,运行在TCP协议之上

标准的http协议指的是不包括cookies, session,application的http协议
但是应用为了有状态,就给HTTP加了cookie和session机制,让使用http的应用也能有状态.

cookie和session的区别

常用的会话跟踪技术是Cookie与Session
Cookie通过在客户端记录信息确定用户身份 , Cookie机制是通过检查客户身上的“通行证”来确定客户身份
Session通过在服务器端记录信息确定用户身份, Session机制就是通过检查服务器上的“客户明细表”来确认客户身份

http https区别

https是基于安全套接字的http协议,使用证书SSL和HTTP的方式进行数据传输.

  • HTTP 标准端口是 80 ,而 HTTPS 的标准端口是 443
  • 在 OSI 网络模型中,HTTPS的加密是在传输层完成的,因为SSL是位于传输层的,TLS的前身是SSL,所以同理
  • HTTP无需认证证书,而https需要认证证书

http包结构

  • 请求报文:由请求行、请求头、空行和请求内容4个部分构成。

    • 请求行:由请求方法、URL、协议版本字段三部分
    • 请求头:key/value对组成,关于客户端的请求信息。
      e.g. User-Agent:生成请求的浏览器类型,Host: 请求的主机名,connection:连接方式(,Cookie: 存储在客户端的扩展字段
  • 响应报文状态行、响应头、空行和响应内容4个部分

    • 状态行:HTTP协议版本、状态码、状态码描述
    • 响应头:响应信息,e.g. Connection: 连接方式,keep-alive的时间

GET方法与POST方法的区别

  • GET - 从指定的资源请求数据。
  • POST - 向指定的资源提交要被处理的数据
get:请求参数是header,
header:url,接口名,请求方法(get),请求参数
body:无
post:请求参数在body中
header:url,接口名,请求方法
body:请求参数

GET方式需要使用Request.QueryString来取得变量的值,而POST方式通过Request.Form来获取变量的值,也就是说Get是通过地址栏来传值,而Post是通过提交表单来传值。

HTTP的状态码

2xx : 代表服务端已经成功接收并处理了该请求
3xx : 通常代表客户端需要进行进一步请求用,常用来进行重定向的状态码
4xx : 通常表示客户端请求有问题
401 : 需要用户进行登录
403 : 服务端收到请求,但是拒绝进行处理
404 : 访问的资源不存在
5xx : 通常表示服务端内部错误
HTTP的状态码

页面请求流程

打开浏览器,输入URL,连接服务器,渲染服务器返回的结果
1、输入网址
2、浏览器查找域名的 IP 地址(DNS域名解析)
3、TCP连接
4、浏览器向 web 服务器发起一个http请求
5、服务器处理请求,并返回响应报文
6、浏览器展示HTML(浏览器页面渲染)
7、断开TCP连接
详细看这里

HTTP长连接

是否为长连接,是通过设置HTTP的Connection Header来决定的,而且是需要两边都设置才有效。 HTTP1.1默认是长连接,而观察我们平时开发的Web应用的HTTP头部,Connection的设置也确实是keep-alive。

但是,HTTP协议是基于请求/响应模式的,因此只要服务端给了响应,本次HTTP连接就结束了,或者更准确的说,是本次HTTP请求就结束了,根本没有长连接这一说。那么自然也就没有短连接这一说了。

之所以网络上说HTTP分为长连接和短连接,其实本质上是说的TCP连接。TCP连接是一个双向的通道,它是可以保持一段时间不关闭的,因此TCP连接才有真正的长连接和短连接这一说。

HTTP 协议的 KeepAlive 意图在于连接复用,同一个连接上串行方式传递请求-响应数据,也就是说复用的是TCP连接。=> 也就是说,长连接情况下,多个HTTP请求可以复用同一个TCP连接,这就节省了很多TCP连接建立和断开的消耗

比如你请求了博客园的一个网页,这个网页里肯定还包含了CSS、JS等等一系列资源,如果你是短连接(也就是每次都要重新建立TCP连接)的话,那你每打开一个网页,基本要建立几个甚至几十个TCP连接,但如果是长连接的话,那么这么多次HTTP请求(这些请求包括请求网页内容,CSS文件,JS文件,图片等等),其实使用的都是一个TCP连接

长连接的保持与断开 / 当保持长连接时,如何判断一次请求已经完成?

长连接并不是永久连接的。如果一段时间内没有请求,这个长连接就会被关闭。具体的是可以在header当中配置参数:

  • keepalive_timeout 配置的,

  • Content-Length,表示实体内容的长度,浏览器通过这个字段来判断当前请求的数据是否已经全部接收。

    所以,当浏览器请求的是一个静态资源时,即服务器能明确知道返回内容的长度时,可以设置Content-Length来控制请求的结束。但当服务器并不知道请求结果的长度时,如一个动态的页面或者数据,Content-Length就无法解决上面的问题

  • Transfer-Encoding,传输编码,告知浏览器当前的编码是将数据分成一块一块传递的

什么时候用长连接,短连接?

  • 长连接多用于操作频繁,点对点的通讯,而且连接数不能太多情况。例如:数据库的连接用长连接, 如果用短连接频繁的通信会造成socket错误
  • 而像WEB网站的http服务一般都用短链接,因为长连接对于服务端来说会耗费一定的资源,而像WEB网站这么频繁的成千上万甚至上亿客户端的连接用短连接会更省一些资源

参考来自

Socket

Socket是应用层与TCP/IP协议族通信的中间软件抽象层,利用三元组【ip地址,协议,端口】通信,它是一组接口。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值