1、socket的通信流程介绍
1.1、什么是socket
Socket是应用层与TCP/IP协议族通信的中间软件抽象层,它是一组接口。在设计模式中,Socket其实就是一个门面模式,它把复杂的TCP/IP协议族隐藏在Socket接口后面,对用户来说,一组简单的接口就是全部,让Socket去组织数据,以符合指定的协议。
我们遵循socket的规定去编程,写出的程序自然就是遵循tcp/udp标准的
注意: 也有人将socket说成ip+port,ip是用来标识互联网中的一台主机的位置,而port是用来标识这台机器上的一个应用程序,ip地址是配置到网卡上的,而port是应用程序开启的,ip与port的绑定就标识了互联网中独一无二的一个应用程序,而程序的pid是同一台机器上不同进程或者线程的标识。
1.2、为何要socket编程
基于socket开发一个C/S或者B/S结构的软件
Client--------网络--------Server
Browser--------网络--------Server
客户端/服务器架构
1.硬件C/S架构(打印机)
2.软件C/S架构(互联网中处处是C/S架构): B/S架构也是C/S架构的一种,B/S是浏览器/服务器
C/S架构与socket的关系: 我们用socket就是为了完成C/S架构的开发
1.3、如何基于socket编程
网络是什么 => 底层的物理链接介质+互联网通信协议
网络存在的意义就是为了通信
2、套接字发展史及分类
2.1、基于文件类型的套接字家族
套接字家族的名字: AF_UNIX
unix一切皆文件,基于文件的套接字调用的就是底层的文件系统来取数据,两个套接字进程运行在同一机器,可以通过访问同一个文件系统间接完成通信
2.2、基于网络类型的套接字家族
套接字家族的名字: AF_INET
(还有AF_INET6被用于ipv6,还有一些其他的地址家族,不过,他们要么是只用于某个平台,要么就是已经被废弃,或者是很少被使用,或者是根本没有实现,所有地址家族中,AF_INET是使用最广泛的一个,python支持很多种地址家族,但是由于我们只关心网络编程,所以大部分时候我么只使用AF_INET)
3、套接字工作流程
服务器端先初始化Socket,然后与端口绑定(bind),对端口进行监听(listen),调用accept阻塞,等待客户端连接。在这时如果有个客户端初始化一个Socket,然后连接服务器(connect),如果连接成功,这时客户端与服务器端的连接就建立了。客户端发送数据请求,服务器端接收请求并处理请求,然后把回应数据发送给客户端,客户端读取数据,最后关闭连接,一次交互结束
代码实现:
import socket
# socket_family 可以是 AF_UNIX 或 AF_INET。socket_type 可以是 SOCK_STREAM 或 SOCK_DGRAM。protocol 一般不填,默认值为 0
socket.socket(socket_family, socket_type, protocal=0)
# 获取tcp/ip套接字
tcpSock = socket.socket(socket.AF_INET, socket.SOCK_STREAM)
# 获取udp/ip套接字
udpSock = socket.socket(socket.AF_INET, socket.SOCK_DGRAM)
# 由于 socket 模块中有太多的属性。我们在这里破例使用了'from module import *'语句。使用 'from socket import *',我们就把 socket 模块里的所有属性都带到我们的命名空间里了,这样能大幅减短我们的代码
tcpSock = socket(AF_INET, SOCK_STREAM)
3.1、服务端套接字函数
s.bind() 绑定(主机,端口号)到套接字
s.listen() 开始TCP监听
s.accept() 被动接受TCP客户的连接,(阻塞式)等待连接的到来
3.2、客户端套接字函数
s.connect() 主动初始化TCP服务器连接
s.connect_ex() connect()函数的扩展版本,出错时返回出错码,而不是抛出异常
3.3、公共用途的套接字函数
s.recv() 接收TCP数据
s.send() 发送TCP数据(send在待发送数据量大于己端缓存区剩余空间时,数据丢失,不会发完)
s.sendall() 发送完整的TCP数据(本质就是循环调用send,sendall在待发送数据量大于己端缓存区剩余空间时,数据不丢失,循环调用send直到发完)
s.recvfrom() 接收UDP数据
s.sendto() 发送UDP数据
s.getpeername() 连接到当前套接字的远端的地址
s.getsockname() 当前套接字的地址
s.getsockopt() 返回指定套接字的参数
s.setsockopt() 设置指定套接字的参数
s.close() 关闭套接字
3.4、面向锁的套接字方法
s.setblocking() 设置套接字的阻塞与非阻塞模式
s.settimeout() 设置阻塞套接字操作的超时时间
s.gettimeout() 得到阻塞套接字操作的超时时间
3.5、面向文件的套接字的函数
s.fileno() 套接字的文件描述符
s.makefile() 创建一个与该套接字相关的文件
4、基于tcp协议的套接字编程
可以通过netstat -an | findstr 8080查看套接字状态
4.1、简单版本
服务端
import socket
server = socket.socket(socket.AF_INET, socket.SOCK_STREAM) # tcp称为流式协议,udp称为数据报协议SOCK_DGRAM
server.bind(('127.0.0.1', 8080))
server.listen(5) # 半连接池,限制的是请求数
conn, addr = server.accept() # (三次握手建立的双向连接,(客户端的ip,端口))
# 通信: 收、发消息
data = conn.recv(1024) # 最大接收的字节数
print('来自客户端发来的数据: {}'.format(data.decode('utf-8')))
conn.send(data.upper())
conn.close()
server.close()
客户端
import socket
client = socket.socket(socket.AF_INET, socket.SOCK_STREAM)
client.connect(('127.0.0.1', 8080)) # 指定服务端ip和端口
# 通信: 收、发消息
client.send('hello'.encode('utf-8'))
data = client.recv(1024)
print('来自服务端发来的数据: {}'.format(data.decode('utf-8')))
client.close()
4.2、添加通信循环
通信循环的作用是:保证服务端一直处于通信状态,不会因为客户端断开链接,服务端直接报错
服务端
import socket
server = socket.socket(socket.AF_INET, socket.SOCK_STREAM) # tcp称为流式协议,udp称为数据报协议SOCK_DGRAM
server.bind(('192.168.11.56', 8080))
server.listen(5) # 半连接池,限制的是请求数
conn, addr = server.accept() # (三次握手建立的双向连接,(客户端的ip,端口))
while True:
try:
# 通信: 收、发消息
data = conn.recv(1024) # 最大接收的字节数
if len(data) == 0:
break
print('来自客户端发来的数据: {}'.format(data.decode('utf-8')))
conn.send(data.upper())
except Exception as e:
break
conn.close()
server.close()
客户端
import socket
client = socket.socket(socket.AF_INET, socket.SOCK_STREAM)
client.connect(('192.168.11.56', 8080)) # 指定服务端ip和端口
while True:
# 通信: 收、发消息
msg = input('请输入需要输入的数据: ').strip()
client.send(msg.encode('utf-8'))
data = client.recv(1024)
print('来自服务端发来的数据: {}'.format(data.decode('utf-8')))
client.close()
4.3、添加链接循环
链接循环的作用是:保证服务端一直处于监听状态,不会因为客户端断开链接,服务端直接退出程序
服务端
import socket
server = socket.socket(socket.AF_INET, socket.SOCK_STREAM) # tcp称为流式协议,udp称为数据报协议SOCK_DGRAM
server.bind(('192.168.11.56', 8080))
server.listen(5) # 半连接池,限制的是请求数
while True:
conn, addr = server.accept() # (三次握手建立的双向连接,(客户端的ip,端口))
while True:
try:
# 通信: 收、发消息
data = conn.recv(1024) # 最大接收的字节数
if len(data) == 0:
break
print('来自客户端发来的数据: {}'.format(data.decode('utf-8')))
conn.send(data.upper())
except Exception as e:
break
conn.close()
server.close()
客户端
import socket
client = socket.socket(socket.AF_INET, socket.SOCK_STREAM)
client.connect(('192.168.11.56', 8080)) # 指定服务端ip和端口
while True:
# 通信: 收、发消息
msg = input('请输入需要输入的数据: ').strip()
client.send(msg.encode('utf-8'))
data = client.recv(1024)
print('来自服务端发来的数据: {}'.format(data.decode('utf-8')))
client.close()
4.4、地址占用问题
4.4.1、解决方式一
# 加入一条socket配置,重用ip和端口
phone=socket(AF_INET,SOCK_STREAM)
phone.setsockopt(SOL_SOCKET,SO_REUSEADDR,1) # 在bind前加
phone.bind(('127.0.0.1',8080))
4.4.2、解决方式二
发现系统存在大量TIME_WAIT状态的连接,通过调整linux内核参数解决
vi /etc/sysctl.conf
编辑文件,加入以下内容:
net.ipv4.tcp_syncookies = 1
net.ipv4.tcp_tw_reuse = 1
net.ipv4.tcp_tw_recycle = 1
net.ipv4.tcp_fin_timeout = 30
然后执行 /sbin/sysctl -p 让参数生效。
net.ipv4.tcp_syncookies = 1 表示开启SYN Cookies。当出现SYN等待队列溢出时,启用cookies来处理,可防范少量SYN攻击,默认为0,表示关闭
net.ipv4.tcp_tw_reuse = 1 表示开启重用。允许将TIME-WAIT sockets重新用于新的TCP连接,默认为0,表示关闭
net.ipv4.tcp_tw_recycle = 1 表示开启TCP连接中TIME-WAIT sockets的快速回收,默认为0,表示关闭。
net.ipv4.tcp_fin_timeout 修改系統默认的 TIMEOUT 时间
4.5、模拟远程执行命令
服务端
import socket
import subprocess
server = socket.socket(socket.AF_INET, socket.SOCK_STREAM)
server.bind(('127.0.0.1', 8080))
server.listen(5)
while True:
conn, addr = server.accept()
while True:
try:
data = conn.recv(1024)
if len(data) == 0:
break
cmd = data.decode('utf-8')
obj = subprocess.Popen(cmd, shell=True,
stdout=subprocess.PIPE,
stderr=subprocess.PIPE
)
conn.send(obj.stdout.read())
conn.send(obj.stderr.read())
except Exception as e:
break
conn.close()
server.close()
客户端
import socket
client = socket.socket(socket.AF_INET, socket.SOCK_STREAM)
client.connect(('127.0.0.1', 8080))
while True:
# 输入发送的命令
cmd = input('请输入命令: ').strip()
# 将命令发送给服务端
client.send(cmd.encode('utf-8'))
# 接收服务端返回的命令结果
data = client.recv(1024)
# 使用gbk转码打印命令结果
print(data.decode('gbk'))
5、基于udp协议的套接字编程
服务端
from socket import *
import time
server = socket(AF_INET, SOCK_DGRAM) # udp使用SOCK_DGRAM参数
server.bind(('127.0.0.1', 8080))
while True:
data, client_addr = server.recvfrom(1024)
print(data.decode('utf-8'))
# time.sleep(10) # 增加时间延迟,证明udp处理数据也是一个一个处理,不是并发处理
server.sendto(data.upper(), client_addr)
客户端
from socket import *
client = socket(AF_INET, SOCK_DGRAM)
while True:
msg = input('请输入信息: ').strip()
client.sendto(msg.encode('utf-8'), ('127.0.0.1', 8080))
data, server_addr = client.recvfrom(1024)
print(data.decode('utf-8'))
6、TCP协议 VS UDP协议
6.1、可靠性
tcp协议是可靠协议:
对方必须回复一个ack确认信息,才会将自己这端的数据从内存中删除
udp协议不可靠:
发送一条消息就会将数据立即删除,不管对方是否接收到
6.2、有无链接
tcp有链接, udp无链接
6.3、传输数据的效率
udp传输效率更高
6.4、粘包问题
tcp存在粘包问题
udp协议称之为数据报协议,每次发送都是一个完整的数据包,一次唯一发送对应一个接收,所以udp协议没有粘包问题