目录
520快到了,你给你的小宝贝们准备好礼物了吗?如果准备好了,想好怎么送了吗?哈哈哈哈~反正我是准备好了,而且还教你怎么送。废话不多说直接上礼物了~
啥是网络编程
从文章的标题我们看到有“网络编程”,那么“网络编程”是啥完犊子呢?网络编程就是在发送端把信息通过规定好的协议进行组装包,在接收端按照规定好的协议把包进行解析,从而提取出对应的信息,达到通信的目的。
啥是 Socket
所谓套接字(Socket),就是对网络中不同主机上的应用进程之间进行双向通信的端点的抽象。一个套接字就是网络上进程通信的一端,提供了应用层进程利用网络协议交换数据的机制。它是通信的基石,是支持TCP/IP协议的路通信的基本操作单元。
套接字的表达方法:套接字Socket=(IP地址:端口号),套接字的表示方法是点分十进制的lP地址后面写上端口号,中间用冒号或逗号隔开。
套接字的通道类型:Unix域套接字,TCP,UDP等。
套接字的术语:
domain - 用作传输机制的协议族。这些值是常量,如:
AF_INET
,AF_UNIX
等。type - 两个端点之间的通信类型,主要是:
SOCK_STREAM
,SOCK_DGRAM和SOCK_RAW。
protocol - 通常为
0
,这可以用于标识域和类型中的协议的变体hostname - 网络接口的标识符。它可以是一个字符串,可以是一个主机名,一个有四个点符号的IP地址,或一个冒号中的IPV6地址符号
port - 每个服务器监听一个或多个端口的客户端的调用
名词解析
TCP(Transmission Control Protocol)传输控制协议,它是提供给用户进程的可靠的全双工字节流面向连接的协议
IP(Internet Protocol)因特网协议。 负责主机间数据的路由和网络上数据的存储。同时为 ICMP,TCP,UDP提供分组发送服务。用户进程通常不需要涉及这一层
HTTP(Hyper Text Transfer Protocol)超文本传输协议
OSI/RM (Open System Interconnection Reference Model)开放式系统互联参考模型
UDP(User Datagram Protocol)用户数据报协议,它是提供一种不可靠无需建立连接的协议
ICMP(Internet Control Message Protocol)因特网控制报文协议,处理路由器和ip主机的差错和传送控制
SMTP(Simple Mail Transfer Protocol)简单邮件传输协议
FTP(File Transfer Protocol)文件传输协议
ARP(Address Resolution Protocol)地址解析协议。它是将网络地址映射到硬件地址。
RARP ( Reverse Address Resolution Protocol ) 反向地址解析协议。它是将硬件地址映射到 网络地址
Python 网络编程
网络服务
在python中提供两个级别的网络服务:
1.低级别的Sochet,它提供标准的BSD Sockets API
2.高级别的SocketServer,它提供了服务器中心类,可以简化网络服务器的开发
网络重要模块
Python网络重要模块如下:
Socket的基本属性和方法
Socket的基本属性如下:
属性 | 描述 |
AF_UNIX | 只用于unix系统通信 |
AF_INET | 服务器之间的网络通信 |
AF_INET6 | IPv6 |
SOCKTEAM | SOCK_STREAM是 提供面向连接、可靠的数据传输服务,它保证数据能够实现无差错、无重复送,并按顺序接收,即SOCK_STREAM是使用TCP 协议就行传输 |
SOCK_DGRAM | SOCK_DGRAM是 提供一种无连 接的服务,它并不能保证数据传输的可靠性,数据有可能在传输过程中丢失或出现数据重复,且无法保证顺序地接收到数据,即SOCK_DGRAM是使用UDP 协议就行传输 |
SOCK_RAW |
|
Socket的基本方法如下:
函数 | 描述 |
---|---|
服务器端套接字 | |
s.bind() | 绑定地址(host,port)到套接字, 在 AF_INET下,以元组(host,port)的形式表示地址。 |
s.listen() | 开始 TCP 监听。backlog 指定在拒绝连接之前,操作系统可以挂起的最大连接数量。该值至少为 1,大部分应用程序设为 5 就可以了。 |
s.accept() | 被动接受TCP客户端连接,(阻塞式)等待连接的到来 |
客户端套接字 | |
s.connect() | 主动初始化TCP服务器连接,。一般address的格式为元组(hostname,port),如果连接出错,返回socket.error错误。 |
s.connect_ex() | connect()函数的扩展版本,出错时返回出错码,而不是抛出异常 |
公共用途的套接字函数 | |
s.recv() | 接收 TCP 数据,数据以字符串形式返回,bufsize 指定要接收的最大数据量。flag 提供有关消息的其他信息,通常可以忽略。 |
s.send() | 发送 TCP 数据,将 string 中的数据发送到连接的套接字。返回值是要发送的字节数量,该数量可能小于 string 的字节大小。 |
s.sendall() | 完整发送 TCP 数据。将 string 中的数据发送到连接的套接字,但在返回之前会尝试发送所有数据。成功返回 None,失败则抛出异常。 |
s.recvfrom() | 接收 UDP 数据,与 recv() 类似,但返回值是(data,address)。其中 data 是包含接收数据的字符串,address 是发送数据的套接字地址。 |
s.sendto() | 发送 UDP 数据,将数据发送到套接字,address 是形式为(ipaddr,port)的元组,指定远程地址。返回值是发送的字节数。 |
s.close() | 关闭套接字 |
s.getpeername() | 返回连接套接字的远程地址。返回值通常是元组(ipaddr,port)。 |
s.getsockname() | 返回套接字自己的地址。通常是一个元组(ipaddr,port) |
s.setsockopt(level,optname,value) | 设置给定套接字选项的值。 |
s.getsockopt(level,optname[.buflen]) | 返回套接字选项的值。 |
s.settimeout(timeout) | 设置套接字操作的超时期,timeout是一个浮点数,单位是秒。值为None表示没有超时期。一般,超时期应该在刚创建套接字时设置,因为它们可能用于连接的操作(如connect()) |
s.gettimeout() | 返回当前超时期的值,单位是秒,如果没有设置超时期,则返回None。 |
s.fileno() | 返回套接字的文件描述符。 |
s.setblocking(flag) | 如果flag为0,则将套接字设为非阻塞模式,否则将套接字设为阻塞模式(默认值)。非阻塞模式下,如果调用recv()没有发现任何数据,或send()调用无法立即发送数据,那么将引起socket.error异常。 |
s.makefile() | 创建一个与该套接字相关连的文件 |
说了那么多方法和属性,我们又不知道怎么使用,好吧~那我们就一个网络的例子吧,如下:
#server.py
import socket
server = socket.socket(socket.AF_INET,socket.SOCK_STREAM)
server.bind(('localhost',9090))
server.listen(5)
while True:
conn,addr = server.accept()
print(conn,addr)
while True:
data = conn.recv(1024)
print('recive:',data.decode())
if data.decode() == "":
break
msg = data.decode() + ' TOO! '
conn.send(msg.encode('gbk'))
conn.close()
break
#client.py
import socket
client = socket.socket(socket.AF_INET,socket.SOCK_STREAM)
client.connect(('localhost',9090))
msg = 'I LOVE YOU! '
while True:
if msg == 'exit':
break
client.send(msg.encode('gbk'))
data = client.recv(1024)
print('recv:',data.decode())
msg = input(">>>")
client.close()
如果你一不小心先点了客户端(client.py),那么就会出现如下情况:
不过大家不用着急,因为我们没有运行服务器(server.py),那我们运行一下让它表演一下:
但是如果手抖一抖,点了两次服务器(server.py),你会发现新大陆:
哈哈哈~又芭比Q了,而从图我们看到“通常每个套接字地址(协议/网络地址/端口)只允许使用一次”
总结
这边文章只是简单谈谈网络编程的基础知识,这基础不管是以后篇章说的网络爬虫还是c/s相关的内容,都会用到这里的基础知识,希望这篇文章对你有所帮助~