http 服务器传文件给客户端6,TCP协议与Wireshark实验

TCP 协议

TCP 协议给使用者提供了两种服务,分别是面向连接的服务和可靠的数据传输服务,我们简单介绍一下。简单来说面向连接的含义是客户机和服务器之间需要建立连接,在位于应用层的数据开始交互之前,TCP 协议首先要先让客户机和服务器进行一次握手。这么做相当于告知彼此接下来需要进行数据的交互,请双方做好准备,具体的实现方式为双方在传输层交互信息。握手阶段结束之后,就能够建立起 TCP 连接,双方应用程序的数据交互完毕之后,还需要切断这个连接。

所谓 TCP 连接是一种逻辑上的连接,它可以提供全双工服务,即应用层数据可以在建立连接的进程之间相互传输。TCP 连接也是点对点的,因为这是针对单个发送方和单个接收方之间的连接。

接下来再看看何谓可靠的数据传输服务,即双方的数据交互在 TCP 协议的保障下,彼此发出的数据能够无差别、按照正确顺序传递给对方。即 TCP 会将发送方通过套接字传出的字节流,在保证字节不发生丢失和出现多余的情况下,将字节流交付给接收方的套接字。

d7a95cc2369992f4a950c1cfaad16f38.png

TCP 报文段结构

984d496572052c698788c68a9ad09694.png

字段解析

源端口、目的端口:各占 2 字节,端口是运输层与应用层的服务接口,运输层的复用和分用功能都要通过端口才能实现。

序号:占 4 字节,TCP 连接中传送的数据流中的每一个字节都编上一个序号,序号字段的值则指的是本报文段所发送的数据的第一个字节的序号。

确认号:占 4 字节,是期望收到对方的下一个报文段的数据的第一个字节的序号。

首部长度:占 4 位,它指出 TCP 报文段的数据起始处距离 TCP 报文段的起始处有多远,的单位是 32 位字(以 4 字节为计算单位)。

保留:占 6 位,保留为今后使用,但目前应置为 0。

接收窗口:占 2 字节,用于流量控制,指示接收方愿意接收的字节数量,单位为字节。

检验和:占 2 字节。检验和字段检验的范围包括首部和数据这两部分。在计算检验和时,要在 TCP 报文段的前面加上 12 字节的伪首部。

选项:长度可变。TCP 最初只规定了最大报文段长度 MSS,表示缓存所能接收的报文段的数据字段的最大长度是 MSS 个字节。

标志字段

紧急 URG:当 URG = 1 时,表明紧急指针字段有效。它告诉系统此报文段中有紧急数据,应尽快传送(相当于高优先级的数据)。

确认 ACK:只有当 ACK = 1 时确认号字段有效,当 ACK = 0 时确认号无效。

推送 PSH(PuSH):接收 TCP 收到 PSH = 1 的报文段,就尽快地交付接收应用进程,不再等到整个缓存都填满了后再向上交付。

复位 RST(ReSeT):当 RST = 1 时,表明 TCP 连接中出现严重差错(如由于主机崩溃或其他原因)必须释放连接,然后再重新建立运输连接。

同步 SYN:同步 SYN = 1 表示这是一个连接请求或连接接受报文。

终止 FIN(FINish):用来释放一个连接。FIN = 1 表明此报文段的发送端的数据已发送完毕,并要求释放运输连接。

捕获从计算机到远程服务器的批量 TCP 传输

首先使用 Wireshark 来获取文件从计算机到远程服务器的 TCP 传输的数据包内容。通过访问一个网页,在网页上输入您计算机上储存的文件名称,然后使用 HTTP POST 方法将文件传输到 Web 服务器,并在此期间运行 Wireshark 以获取从计算机发送和接收的 TCP 区段的内容。执行如下操作:

在电脑上保存一个 ASCII 档案文件:

b4b34089b527c22355531173ec154fad.png

3. 使用此表单中的“选择文件”按钮上传文件:

456a07237e11f02f4c04bfaf2859db56.png

4. 启动 Wireshark 并开始数据包捕获:

f997cf5ab7ff1435127763ce86aa84cc.png

5. 返回浏览器,按 “Upload alice.txt file” 按钮将文件上传到 gaia.cs.umass.edu 服务器:

11d4a300e9cd11feb1435b2af262bb70.png

6.停止 Wireshark 数据包捕获:

干扰巨大,我还是用现成的包来分析吧。

4ca7e01e49a49cb1012d2f64707d0abb.png

跟踪包的初步观察

在过滤器指定窗口中输入 “tcp” 过滤 Wireshark 视窗中显示的数据包:

d74e0b92f4d9b8c71829daf6f5b79ae0.png

可以应该看到的是计算机和 gaia.cs.umass.edu 之间的一系列 TCP 和 HTTP 讯息,首先是看到包含 SYN 讯息的初始三次握手。

b5659ef9886922f5ea4a0cd08087dcc8.png

接下来有 HTTP POST 讯息。

448093d2d8a8f0c788a1abe035813370.png

在 Wireshark 显示的 Info 列中有不少“[重新组装的 PDU 的 TCP 段]”,以指示此 TCP 区段包含属于上层协议讯息的数据(这里是 HTTP)。

e063c916d65bb06c38b8b87976b86895.png

还有 gaia.cs.umass.edu 返回到您的计算机的 TCP ACK 区段。

78d3d818fc51a5888d05a76a66d67ab7.png

回答以下问题:

将文件传输到 gaia.cs.umass.edu 的客户端计算机(源)使用的 IP 地址和 TCP 端口号是什么?

2ccdb5351c0630fec597ab0bf22b855c.png

IP 地址:192.168.1.102

TCP 端口号:1161

2. gaia.cs.umass.edu 的 IP 地址是什么? 在哪个端口号上发送和接收此连接的 TCP 区段?

29df4455dd6f538c6117d0b20ee0d988.png

IP 地址:128.119.245.12

接收连接的端口号:80

现在我们关注 TCP 而不是 HTTP,因此更改 Wireshark 的“捕获数据包列表”视窗,以便显示有关包含 HTTP 讯息的 TCP 区段的信息。要让 Wireshark 执行此操作,选择 Analyze-> Enabled Protocols。

bc5ada3b55b84312c47d2ee4422dba9f.png

然后取消勾选 HTTP 框,并选择确定。

f37cda921c5f8f3702aafeafe88de36c.png

这些是计算机和 gaia.cs.umass.edu 之间发送的一系列 TCP 区段。

TCP Basics

回答下列问题:

用于在客户端计算机和 gaia.cs.umass.edu 之间启动 TCP 连接的 TCP SYN 区段的序列号是什么?将区段标识为 SYN 区段的区段有什么功能?

51f526f34923f75ae7c6e958a5bab13c.png

序列号为 0,功能是开始三次握手,主机发送 SYN 请求服务器建立连接,这是三次握手的第一步。

2. gaia.cs.umass.edu 发送给客户端计算机以回复 SYN 的 SYNACK 区段的序列号是多少?

81d48190ee03371319135928d236b957.png

序列号为 0。

SYNACK 区段中的 Acknowledgment 栏位的值是多少?

7789aa155544b239e1b2948fb0be8b05.png

2c8a20168b8aa05703d432227ae9d97b.png

Acknowledgment 栏位的值是 1。

Gaia.cs.umass.edu 是如何确定此 Acknowledgment 的数值的?在将区段标识为 SYNACK 区段的区段在连线中有什么功能?

Ack 字段用于表示确认字段中的值是有效的,功能是说明服务器成功接收了我们发出的连接请求,并发送 SYN-ACK 确认报文。

3. 包含 HTTP POST 命令的 TCP 区段的序列号是多少?

129ad76b542c28df1babbab896f9eb08.png

序列号为 1,其中 PSH 表示有数据传输。

4. 将包含 HTTP POST 的 TCP 区段视为 TCP 连接中的第一个区段。前六个 TCP 区段的长度是多少?在这个 TCP 连线中前 6 个 TCP 区段的序列号是什么(包括包含 HTTP POST 的段)?每区段发送的时间是什么时候?收到的每个区段的 ACK 是什么时候?鉴于发送每个 TCP 区段的时间与收到确认的时间之间的差异,六个区段中每个区段的 RTT 值是多少?收到每个 ACK 后,EstimatedRTT 值是什么?假设第一个 EstimatedRTT 的值等于第一个区段的测量 RTT。

EstimatedRTT 运算公式

EstimatedRTT = (1 - a) × EstimatedRTT + a × SampleRTT

其中 a 使用推荐值 0.125。

区段一:

d36ee4175bb8b9dfdb2f72b7fdb2f940.png

长度:565

序列号:1

发送时间:2004 年 8 月 21 日 21:44:20.596858000

7076f5e42edff220b816f06d759061bc.png

RTT:0.027460000 seconds

EstimatedRTT = RTT = 0.027460000 seconds

区段二:

2fc9654059e28fd63b48961f46471cdf.png

长度:1460

序列号:566

发送时间:2004 年 8 月 21 日 21:44:20.612118000

4a63ed5567fe93d58d693063378127ad.png

RTT:0.035557000 seconds

EstimatedRTT = 0.875 × 0.027460000 + 0.125 × 0.035557000 = 0.028472125 seconds

区段三:

15ce160ea9c00178cf92c2085b9c2b9a.png

长度:1460

序列号:2026

发送时间:2004 年 8 月 21 日 21:44:20.624407000

ec857a3f82626f87a6dc680ed4cd18ee.png

RTT:0.070059000 seconds

EstimatedRTT = 0.875 × 0.028472125 + 0.125 × 0.070059000 = 0.033670484 seconds

区段四:

7af68b85e38e5a3a0226c4014929f43d.png

长度:1460

序列号:3486

发送时间:2004 年 8 月 21 日 21:44:20.625071000

30b56f99c3d053ce3b04f5ec8d53d8bc.png

RTT:0.114428000 seconds

EstimatedRTT = 0.875 × 0.033670484 + 0.125 × 0.114428000 = 0.043765173 seconds

区段五:

761b4bdd088619e35c8e1c5f6fd4ef3b.png

长度:1460

序列号:4946

发送时间:2004 年 8 月 21 日 21:44:20.647786000

f37fcd4ac8bbae5a196f02b878378818.png

RTT:0.139894000 seconds

EstimatedRTT = 0.875 × 0.043765173 + 0.125 × 0.139894000 = 0.055781277 seconds

区段六:

69f8aad72a169b0c756c2e23dc306524.png

长度:1460

序列号:6406

发送时间:2004 年 8 月 21 日 21:44:20.648538000

dddb7331463fbed63714b4ef7b1d4317.png

RTT:0.189645000 seconds

EstimatedRTT = 0.875 × 0.055781277 + 0.125 × 0.189645000 = 0.072514242 seconds

0e11a32b3847e8694230268b180bab12.png

5. 对于整个跟踪包,收到的最小可用缓冲区空间量是多少?缺少接收器缓冲区空间是否会限制发送方传送 TCP 区段?

554897e1621bb1a23e66f2aff7a30777.png

对于服务器而言,收到的最小可用缓冲区空间量为 6780。

08cad3c05cd5cc6f4bebf2d83a25a651.png

对于主机而言,收到的最小可用缓冲区空间量为 5840。

缺少接收器缓冲区空间会限制发送方传送 TCP 区段,这是因为 TCP 的流量控制服务,能够消除发送方使接收方缓存溢出的可能性,使得发送方的发送速率与接收方应用程序的读取速率相匹配。实现的方式是滑动窗口协议,具体可参考后文附带的资料。

6. 在跟踪文件中是否有重传的区段?

检查数据包的时间序列:

3969dbdfdda8f18d6369c746a975e044.png

因为序列号呈增大趋势,因此没有重传。

7. 接收器通常在 ACK 中确认多少数据?是否可以识别接收方每隔一个接收到的区段才发送确认的情况?

(这个回答难以保证正确,欢迎纠错)接收器通常在 ACK 中确认序列号,可以确认,根据 ACK 序列号的顺序来推测。

8. TCP 连接的吞吐量(每单位时间传输的⫿节数)是多少?如何计算这个值?

平均吞吐量 = 传输数据的比特数 F ÷ 接收方接收所有数据所用时间 T

首先看看传输数据的比特数 F = 164090 bytes

24676b7657708e72c7856bd6d607d65a.png

再看看接收方接收所有数据所用时间 T = 5.297341000 seconds

da35fdfc3046cf8de4778c8db7c29008.png

吞吐量 = 164090 ÷ 5.297341000 = 30.975917918064 Kb/s

TCP 拥塞控制

现在检查从客户端服务器的每单位时间发送的数据量,从 Wireshark 窗口中的原始数据计算这些数值。

d40082b35edc511e03ac7c8d0abfdb7d.png

每个点代表一个发送的 TCP 区段,绘制区段的序列号与发送的时间,堆叠在一起的一组点表示发送方背靠背发送的一系列数据包。使用时序图(Stevens)查看从客户端发送到 gaia.cs.umass.edu 服务器的区段的序列号与时间关系图。您能否确定 TCP 的慢启动阶段的开始和结束位置,以及拥塞避免接管的位置?

慢启动的原理是:连接开始时,发送速率呈指数型增长。因此 TCP 开始发送的速率很慢,但是慢启动阶段增长很快。

0da30568f79caff89b7142eb8ba13008.png

如图所示,慢启动阶段的开始肯定是在第一个 TCP 区段发出去的时候,也就是分组 5 发送的时候。

9cc153a3372e394b0fb645b3e58f9e50.png

结束位置是什么时候?观察到这样的指数型增长的速率在分组 23 处卡壳了,说明这个时候发生了拥塞,进入拥塞避免阶段。

bdd4cb82555986940e59939544112d0e.png

这个区域就是拥塞避免区段。

255b13c3ec9acbb6678fb5252a9d8a28.png

2. 评论测量数据与我们在文本中研究的 TCP 的理想化行为的不同之处。

慢启动是 TCP 在拥塞控制方面做的努力之一,但是对于一些数据量较小的小文件,在网络畅通的情况下发送非常快,甚至可能在慢启动结束之前就已经发送完毕。这个问题要怎么理解呢?例如我需要发送一个 5 单位大小的文件,假定一个窗口在一个单位时间内可以发送一个单位大小的数据报。如果是初始窗口为 1 个的慢启动,窗口按照指数型增长,就需要 3 个单位时间才能发送完毕。而如果一开始就拥有大于 5 个的窗口,则 1 个单位时间就可以发送完毕,这个时候慢启动反而来制约了文件的快速发送,从而影响了效率。

由此可见慢启动并不是永远都是高效的,在一些情况下效率不会达到最好。这种情况不可否认,不过慢启动在拥塞控制方面的贡献,在总体上仍然是一个很好的手法!

参考资料

《计算机网络 自顶向下方法》 [美] James F.Kurose,Keith W.Ross 著,陈鸣 译,机械工业出版社

TCP

滑动窗口协议

一篇带你读懂TCP之“滑动窗口”协议

  • 3
    点赞
  • 15
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值