1. 网络编程基础
- 网络编程:让不同电脑上的软件进行数据传递,即进程间通信。
- IP地址:用来标记网络主机。
- 每一个IP地址包括两部分:网络地址和主机地址。根据网络地址和主机地址分为:A B C D E类。具体内容参考:https://www.cnblogs.com/tunian/p/9632893.html
- 端口:端口通过端口号标记,可通过IP+端口号来区分不同服务。常用端口对照表:https://blog.csdn.net/l_smalltiger/article/details/81951824
2. 套接字
套接字是一种“通信端点”,网络化的应用程序在开始任何通讯之前需要创建套接字。套接字分类:
面向连接的套接字:在通讯之前建立一条连接,也称为流套接字。面向连接的通信方式提供了可靠的、顺序的、不会重复的数据传输,也不会被加上数据边界。这也代表每个发送的消息可能会被拆为多份,没有顺序地正确到达目的地,然后被重新拼接起来。实现这种连接的主要协议是传输控制协议(TCP)。创建TCP套接字需要指定套接字类型为SOCK_STREAM。
无连接即数据报型的无连接套接字。即无需建立连接就可进行通讯,但此时数据到达的顺序、完整性及不重复性无法保证。数据报会保留数据边界,即数据是整个发送的。实现这种连接的主要协议是用户数据报协议(UDP)。创建UDP套接字需要指定套接字类型为SOCK_DGRAM。
2.1 套接字使用:
套接字使用流程和文件很相似:创建套接字、使用套接字收发数据、关闭套接字。
python使用socket()模块来创建套接字,完成基于套接字的网络通信。
函数 socket.socket() 创建一个 socket,该函数带有两个参数:
- Address Family:可以选择 AF_INET(用于 Internet 进程间通信) 或者 AF_UNIX(用于同一台机器进程间通信),实际工作中常用AF_INET
- Type:套接字类型,可以是 SOCK_STREAM(流式套接字,主要用于 TCP 协议)或者 SOCK_DGRAM(数据报套接字,主要用于 UDP 协议)
套接字中常用的函数如下:
2.2 udp套接字
udp通信模型
udp服务器
recvfrom方法:
- data, addr = server_socket.recvfrom()
- 方法返回两个值,第一个值为接收到的二进制数据,第二个数据是一个元组形式(IP, PORT),标记客户端的地址。第一个元素为客户端的IP地址字符串,第二个元素为客户端端口号。
sendto方法:
- server_socket.sentto(data, addr)
- sendto方法接受两个参数,第一个为发送的数据(二进制形式,需要编码),第二个为客户端的地址(从recvfrom方法得到)
import socket
# 定义服务器IP及端口
HOST = "" # 字符串留空或者localhost代表本地,也可自定义Ip
PORT = 7890
ADDR = (HOST, PORT)
def main():
# 定义服务器套接字
server_socket = socket.socket(socket.AF_INET, socket.SOCK_DGRAM)
# 绑定地址
server_socket.bind(ADDR)
# 通信循环:收发消息
while True:
print("waiting for messages......")
# 接受客户端消息
recv_data, addr = server_socket.recvfrom(1024)
print("receive messages:%s from %s" % (recv_data.decode("gbk"), str(addr)))
if recv_data.decode("gbk") == "exit":
break
# 发送消息到客户端
send_data = "我是UDP服务器,已接收到你发来的消息!"
server_socket.sendto(send_data.encode("gbk"), addr)
# 关闭服务端套接字
server_socket.close()
if __name__ == '__main__':
main()
udp客户端
import socket
# 定义要连接的服务端地址
HOST = ""
PORT = 7890
ADDR = (HOST, PORT)
def main():
# 定义客户端套接字
client_socket = socket.socket(socket.AF_INET, socket.SOCK_DGRAM)
# 通信循环:收发消息
while True:
# 客户端先发送消息
send_data = input("请输入要发送的数据:")
if not send_data:
break
client_socket.sendto(send_data.encode("gbk"), ADDR)
recv_data, addr = client_socket.recvfrom(1024)
# 打印服务器发过来的数据
print(recv_data.decode("gbk"))
# 关闭客户端套接字
client_socket.close()
if __name__ == '__main__':
main()
2.3 tcp套接字
tcp通信模型
TCP服务器
伪代码:
server_socket.accept方法:
- tmp_socket, addr = server_socket.accept()
- 该方法返回两个数据,第一个为一个临时的套接字用于标记当前连接的客户端及用来与客户端进行通信;第二个为当前连接客户端的地址信息(ip,port)
import socket
# 定义服务器地址:主机名/ip、端口号
Host = ''
PORT = 7890
ADDR = (Host, PORT)
def main():
# 定义TCP套接字
server_socket = socket.socket(socket.AF_INET, socket.SOCK_STREAM)
# 绑定地址
server_socket.bind(ADDR)
# 开始监听(变为被动)
server_socket.listen(128)
# 通信循环:用来循环接受客户端连接
while True:
# 接受客户端连接
tmp_socket, addr= server_socket.accept() # 返回一个临时套接字(用于客户端通信)及客户端的地址
print("connect from :", addr)
# 通信循环:使用临时套接字收发数据
while True:
recv_data = tmp_socket.recv(1024)
if not recv_data:
break
print(recv_data.decode("gbk"))
send_data = "我是一个TCP服务器!!"
tmp_socket.send(send_data.encode("gbk"))
tmp_socket.close() # 关闭临时套接字
server_socket.close() # 关闭监听套接字
if __name__ == '__main__':
main()
TCP客户端
伪代码:
import socket
# 定义要连接的服务器端地址
Host = ""
PORT = 7890
ADDR = (Host, PORT)
def main():
# 定义tcp客户端套接字
client_socket = socket.socket(socket.AF_INET, socket.SOCK_STREAM)
# 连接tcp服务器
client_socket.connect(ADDR)
# 通信循环:收发数据
while True:
send_data = input("请输入要发送的数据:")
# 发送数据给服务器
client_socket.send(send_data.encode("gbk"))
# 从服务器接收数据并打印
recv_data = client_socket.recv(1024)
if not recv_data:
break
print(recv_data.decode("gbk"))
client_socket.close()
if __name__ == '__main__':
main()
tcp注意点
- tcp服务器一般情况下都需要绑定,否则客户端找不到这个服务器
- tcp客户端一般不绑定,因为是主动链接服务器,所以只要确定好服务器的ip、port等信息就好,本地客户端可以随机
- tcp服务器中通过listen可以将socket创建出来的主动套接字变为被动的,这是做tcp服务器时必须要做的
- 当客户端需要链接服务器时,就需要使用connect进行链接,udp是不需要链接的而是直接发送,但是tcp必须先链接,只有链接成功才能通信
- 当一个tcp客户端连接服务器时,服务器端会有1个新的套接字,这个套接字用来标记这个客户端,单独为这个客户端服务
- listen后的套接字是被动套接字,用来接收新的客户端的链接请求的,而accept返回的新套接字是标记这个新客户端的
- 关闭listen后的套接字意味着被动套接字关闭了,会导致新的客户端不能够链接服务器,但是之前已经链接成功的客户端正常通信。
- 关闭accept返回的套接字意味着这个客户端已经服务完毕
- 当客户端的套接字调用close后,服务器端会recv解堵塞,并且返回的长度为0,因此服务器可以通过返回数据的长度来区别客户端是否已经下线
tcp的三次握手及四次挥手