TCP发送数据流程详解

最新推荐文章于 2023-05-27 11:06:46 发布

VIP文章鱼思故渊

最新推荐文章于 2023-05-27 11:06:46 发布

阅读量1.5w

点赞数 5

分类专栏： linux网络编程文章标签： TCP

本文链接：https://blog.csdn.net/yusiguyuan/article/details/17710141

版权

B/S通信简述

整个计算机网络的实现体现为协议的实现，TCP/IP协议是Internet的核心协议，HTTP协议是比TCP更高层次的应用层协议。

HTTP（HyperText Transfer Protocol，超文本传输协议）是互联网上应用最为广泛的一种网络协议。所有的WWW文件都必须遵守这个标准。设计HTTP的初衷是为了提供一种发布和接收HTML页面的方法。

浏览器（Web Browser）负责与服务器建立连接，下载网页（包括资源文件及JS脚本文件）到本地，并最终渲染出页面。JS脚本文件运行在客户端，负责客户端一些行为响应或预处理，例如提交表单前的数据校验、鼠标事件处理等交互。由此可见，浏览器（Browser）一方面充当了C/S通信架构中C角色，另一方面它是HTML/JavaScript的解析渲染引擎（Analyze Render Engine）。

在浏览器地址栏敲入“http://www.baidu.com/”，按下回车键，浏览器中呈现出百度首页。这样一种情景我们再熟悉不过，本文通过wireshark抓取这一过程的TCP/IP数据包，结合TCP协议分析HTTP通信的基本流程。

MTU和MSS

本文用到的抓包工具为wireshark，它的前身是赫赫有名的Ethereal。wireshark以太网帧的封包格式为：

Frame = Ethernet Header + IP Header + TCP Header + TCP Segment Data

（1）Ethernet Header =14 Byte = Dst Physical Address（6 Byte）+ Src Physical Address（6 Byte）+ Type（2 Byte），以太网帧头以下称之为数据帧。

（2）IP Header =20 Byte（without options field），数据在IP层称为Datagram，分片称为Fragment。

（3）TCP Header = 20 Byte（without options field），数据在TCP层称为Stream，分段称为Segment（UDP中称为Message）。

（4）54个字节后为TCP数据负载部分（Data Portion），即应用层用户数据。

Ethernet Header以下的IP数据报最大传输单位为MTU（Maximum Transmission Unit，Effect of short board），对于大多数使用以太网的局域网来说，MTU=1500。

TCP数据包每次能够传输的最大数据分段为MSS，为了达到最佳的传输效能，在建立TCP连接时双方协商MSS值，双方提供的MSS值的最小值为这次连接的最大MSS值。MSS往往基于MTU计算出来，通常MSS=MTU-sizeof(IP Header)-sizeof(TCP Header)=1500-20-20=1460。

这样，数据经过本地TCP层分段后，交给本地IP层，在本地IP层就不需要分片了。但是在下一跳路由（Next Hop）的邻居路由器上可能发生IP分片！因为路由器的网卡的MTU可能小于需要转发的IP数据报的大小。这时候，在路由器上可能发生两种情况：

（1）.如果源发送端设置了这个IP数据包可以分片（May Fragment，DF=0），路由器将IP数据报分片后转发。

（2）.如果源发送端设置了这个IP数据报不可以分片（Don’t Fragment，DF=1），路由器将IP数据报丢弃，并发送ICMP分片错误消息给源发送端。

关于MTU的探测，参考《Path MTU discovery》。我们可以通过基于ICMP协议的ping命令来探测从本机出发到目标机器上路由上的MTU，详见下文。

TCP和UDP

在基于传输层（TCP/UDP）的应用开发中，为了最后的程序优化，应避免端到端的任何一个节点上出现IP分片。TCP的MSS协商机制加上序列号确认机制，基本上能够保证数据的可靠传输。

UDP协议在IP协议的基础上，只增加了传输层的端口（Source Port+Destination Port）、UDP数据包长（Length = Header+Data）以及检验和（Checksum）。因此，基于UDP开发应用程序时，数据包需要结合IP分片情况考虑。对于以太局域网，往往取UDP数据包长Length<=MTU-sizeof(IP Header)=1480，故UDP数据负载量小于或等于1472（Length-UDP Header）；对于公网，ipv4最小MTU为576，UDP数据负载量小于或等于536。

“向外”NAT在内网和公网之间提供了一个“不对称”桥的映射。“向外”NAT在默认情况下只允许向外的session穿越NAT：从外向内的的数据包都会被丢弃掉，除非NAT设备事先已经定义了这些从外向内的数据包是已存在的内网session的一部分。对于一方在LAN，一方在WAN的UDP通信，鉴于UDP通信不事先建立虚拟链路，NAT后面的LAN通信方需先发送消息给WAN通信方以洞穿NAT，然后才可以进行双向通信，这即是常提到的“UDP打洞（Hole Punching）”问题。

TCP连接百度过程解析

下文对百度的完整抓包建立在不使用缓存的基础上。如若主机存有百度站点的cookie和脱机缓存（Offline Cache），则不会再请求地址栏图标favicon.ico；请求/js/bdsug.js?v=1.0.3.0可能回应“HTTP/1.1 304 Not Modified”。可在浏览器打开百度首页后，Ctrl+F5强制刷新，不使用缓存，也可参考《浏览器清除缓存方法》。

以下为访问百度过程，wireshark抓包数据。对于直接通过Ethernet联网的机器，Wireshark Capture Filter为"host www.baidu.com"；对于通过PPP over Ethernet（PPPoE）联网的机器，Wireshark Capture Filter为"pppoes and hostwww.baidu.com"。以下抓包示例直接通过Ethernet联网访问百度的过程。可点击图片超链接下载pcap文件，使用wireshark软件查看。

为方便起见，以下将客户端（浏览器）简称为C，将服务器（百度）简称为S。

1．TCP三次握手建立连接

“http://”标识WWW访问协议为HTTP，根据规则，只有底层协议建立连接之后才能进行更高层协议的连接。在浏览器地址栏输入地址后按下回车键的瞬间，C建立与S（机器名为www.baidu.com，DNS解析出来的IP为220.181.6.175）的TCP 80连接（HTTP默认使用TCP 80端口）。

以下为三次握手建立TCP连接的数据包（Packet1-Packet3）。

1 192.168.89.125:5672→ 220.181.6.175:80 TCP(协议) 62(以太网帧长)

amqp > http [SYN] Seq=0 Win=65535 Len=0 MSS=1460SACK_PERM=1

2 220.181.6.175:8

最低0.47元/天解锁文章

鱼思故渊

关注

5
点赞
踩
19

收藏

觉得还不错? 一键收藏
0
评论
TCP发送数据流程详解

B/S通信简述整个计算机网络的实现体现为协议的实现，TCP/IP协议是Internet的核心协议，HTTP协议是比TCP更高层次的应用层协议。HTTP（HyperText Transfer Protocol，超文本传输协议）是互联网上应用最为广泛的一种网络协议。所有的WWW文件都必须遵守这个标准。设计HTTP的初衷是为了提供一种发布和接收HTML页面的方法。浏览器（Web Browse
复制链接

扫一扫