前言
也许大家有时会想到,平常我们从网上下载数据的原理是什么?这些数据是从哪里来的,又为什么可以下载到自己的电脑上,其实这些都使用了一些特殊的协议,这里简单讲解一下tcp下载器功能的实现。
TCP概述
tcp介绍:
tcp通信需要经过创建连接、数据传送、中止连接三个步骤。
tcp通信模型中,在通信开始之前,一定要先建立相关的链接,才能发送数据,类似于生活中的打电话
TCP特点
-
1.面向连接:通信双方必须先建立连接才能进行数据的传输,双方间的数据传输都可以通过这一个连接进行,在完成数据交换后,双方必须断开此链接,以释放系统资源。
这种链接是一对一的,因此TCP不适用于广播的应用程序,基于广播的应用协议应使用UDP协议。 -
2 可靠传输
- TCP采用发送应答机制TCP发送的每个保温段都必须得到接收方的应答才认为这个TCP报文段传输成功
- 超时重传
发送端发出一个报文段之后就启动定时器,如果在定时时间内没有收到应答就重新发送这个报文段。 - 错误校验
TCP用一个校验和函数来检验数据是否有错误,在发送和接收时都要计算校验和。 - 流量控制和阻塞管理
流量控制用来避免主机发送得过快而使接收方来不及完全收下。
TCP与UDP的不同点
- 面向连接(确认有创建三方交握,连接一创建才做传输)
- 有序数据传输
- 重发丢失的数据包
- 舍弃重复的数据包
- 无差错的数据传输
- 阻塞/流量控制
简单来说,tcp更稳定,但也比较复杂,udp简单,但容易丢失数据
那么,打造一个下载器应该有客户端和服务端两部分
构造tcp下载器之客户端
这个客户端的内容是用来发送数据给服务器,返回需要下载的内容,然后将这个内容保存到本地,类似于我们去电影网站上下载电影,发送下载请求指令之后,服务器得到响应,找到该资源并下载。
构建tcp客户端一般有如下几步:
- 创建tcp套接字
- 链接服务端(server)
- 收发数据
- 关闭套接字
第一步:我们要创建一个tcp的套接字(socket)
# 1.创建套接字
tcp_socket = socket.socket(socket.AF_INET, socket.SOCK_STREAM)
第二步,链接服务器,注意,使用connect链接,且里面的参数为一个元组,分别是服务器的ip地址和端口号,ip地址为字符串类型,端口号为整数类型
tcp_socket.connect(("192.168.79.1", 7890))
第三步:发送需要下载数据,使用send方法进行发送,发送的内容需要以字节流形式传输,所以这里需要编码
# 3.发送需要下载的数据
data = input("请输入你要下载的数据")
tcp_socket.send(data.encode('gbk'))
第四步:下载服务器返回的内容
# 4.下载服务器返回的数据
recv_data = tcp_socket.recv(1024)
print("接收到的数据是:", recv_data)
if recv_data: # 如果返回的recv_data有内容,则下载数据
with open("新" + data, "wb") as f:
f.write(recv_data)
第五步:关闭套接字
# 5.关闭套接字
tcp_socket.close()
完整代码:
import socket
def main():
# 1.创建套接字
tcp_socket = socket.socket(socket.AF_INET, socket.SOCK_STREAM)
# 2.连接
tcp_socket.connect(("192.168.79.1", 7890))
# 3.发送需要下载的数据
data = input("请输入你要下载的数据")
tcp_socket.send(data.encode('gbk'))
# 4.下载服务器返回的数据
recv_data = tcp_socket.recv(1024)
print("接收到的数据是:", recv_data)
if recv_data: # 如果返回的recv_data有内容,则下载数据
with open("新" + data, "wb") as f:
f.write(recv_data)
print("文件保存成功...")
# 5.关闭套接字
tcp_socket.close()
if __name__ == '__main__':
main()
这里我们使用网络测试工具来验证我们的代码,首先打开软件,创建tcp服务器, IP地址和端口号与代码中所连接的地址保持一致
运行程序,发送数据,返回要下载的文件
这时我们的同级目录下就有一个新的文件叫做hello.py的文件,打开发现文件夹中是如下内容。
这样一个简单的客户端就构建完成了
TCP下载器之服务端
服务端所经历的流程
- 创建套接字
- 绑定自身端口
- 将套接字设置为被动连接状态
- 等待被连接
- 收发数据
- 关闭套接字
第一步:创建套接字
# 1. 创建套接字
tcp_server_socket = socket.socket(socket.AF_INET, socket.SOCK_STREAM)
第二步: 绑定本地地址和端口号,使用bind绑定,参数为一个元组,里面是本地IP地址和端口号
# 2.绑定本地地址
tcp_server_socket.bind(("192.168.79.1", 7890))
第三步:设置被动连接,也就是只能让客户端连接服务器,而不是让服务器连接客户端
tcp_server_socket.listen(128)
第四步:等待连接,使用accept等待连接,返回一个元组,使用拆包的方式赋值给一个新的客户端套接字和客户端地址信息, 且收发数据都由新的客户端套接字完成
new_client_socket, client_address = tcp_server_socket.accept()
第五步:收发数据:从客户端发过来的数据文件在目录中查找,如果文件存在,则发送将文件内容发送过去进行下载,若文件不存在,则返回错误信息
# 5.获取接收到的文件名
recv_data = new_client_socket.recv(1024)
print("客户端要下载的数据是:", recv_data)
try:
f = open(recv_data, "rb")
new_client_socket.send(f.read()) # 发送文件进行下载
f.close()
print("发送成功...")
except Exception as e: # 如果文件名不存在,则返回错误信息。
print("没有要下载的文件..")
第六步:关闭套接字
# 7.关闭套接字
new_client_socket.close()
tcp_server_socket.close()
TCP服务器的完整代码
import socket
def main():
# 1. 创建套接字
tcp_server_socket = socket.socket(socket.AF_INET, socket.SOCK_STREAM)
# 2.绑定本地地址
tcp_server_socket.bind(("192.168.79.1", 7890))
# 3.设置被动连接
tcp_server_socket.listen(128)
# 4.等待连接
print("正在等待连接...")
new_client_socket, client_address = tcp_server_socket.accept()
print("已连接到%s" % str(client_address)) # 查看以连接方的IP地址和端口号
# 5.获取接收到的文件名
recv_data = new_client_socket.recv(1024)
print("客户端要下载的数据是:", recv_data)
# 6.打开文件,将文件中的内容发送过去,进行下载
try:
f = open(recv_data, "rb")
new_client_socket.send(f.read()) # 发送文件进行下载
f.close()
print("发送成功...")
except Exception as e: # 如果文件名不存在,则返回错误信息。
print("没有要下载的文件..")
# 7.关闭套接字
new_client_socket.close()
tcp_server_socket.close()
if __name__ == '__main__':
main()
TCP下载器
首先我在统计目录下创建一个文件为a.txt
内容如下
接着先运行服务器等待连接,在运行客户端,将要下载的文件a.txt发送过去
服务器正在等待连接,此时为堵塞状态,当有客户端链接时,即可解堵塞
然后运行客户端, 此时发送所要下载的数据,这里我发送a.txt,服务器就会返回a.txt中内容,并保存在一个新的文件中
客户端得到的内容
服务器收到的响应:
那么在同级目录下就有了一个新的文件叫做,新a.txt
内容如下:与原文件a的内容相同
可以看出,虽然在终端中运行代码时返回的是乱码,但是在文件中并没有出现,这是因为在Windows环境中默认使用gbk方式进行编码,所以在解码时也只能使用gbk,所以在返回值时会出现乱码的情况。
TCP总结
流程
tcp客户端
- socket.socket(socket.AF_INET, socket.SOCK_STREAM) 创建套接字
- connect() 链接服务器
- recv()/send() 收发数据
- close() 关闭
tcp服务器
- socket.socket(socket.AF_INET, socket.SOCK_STREAM) 创建套接字
- bind() 绑定本地端口
- listen() 设置为被动连接
- accept() 等待连接,以元组的方式返回一个新的套接字、客户端的IP地址和端口号
- recv/send 收发数据
- close() 关闭套接字
总结
- tcp服务器一般情况下都需要绑定,否则客户端找不到这个服务器
- tcp客户端一般不绑定,因为是主动连接服务器,所以只要确定好服务器的ip,port等信息就好,本地客户端可以随机
- TCP服务器通过listen可以将socket创建出来的台阶子变为被动的,这是做TCP服务器时必须做的, 否则这个服务器就只能连接其他机器,而其他机器不能连接服务器。
- 当客户端需要连接服务时,就需要使用connect进行连接,udp不需要连接而是直接发送,但是tcp必须线连接,只有链接成功才能通信
- 当一个tcp客户端连接服务器时,服务器端会有一个新的套接字,这个套接字用来标记这个客户端,单独为这个客户端服务
- listen后的套接字时被动套接字,用来接收新的客户端的链接请求的,而accept返回的新套接字时标记这个新客户端的
- 关闭listen后的套接字一位置被动台阶子关闭了,会导致新的客户端不能跟狗连接服务器,但是之前已经链接成功的客户端正常通信。
- 关闭accept返回后的套接字意味着这个客户端已经服务完毕
- 当客户端的套接字调用close后, 服务器端会recv解堵塞,并且返回的长度为0,因此服务器可以通过返回的数据的长度来区别客户端是否已经下线