上周五的时候,同事们在讨论send()
和sendall()
的区别,依稀记得曾几何时,我确实研究过这个问题,但是事过已久,头脑中已经忘却了一些重要的部分,所以今天查阅了一些资料,重新找回失去的东西,并在此记录下…
估计每个学习Python
网络编程的人,都会遇到过这样的问题:
send()
和sendall()
到底有什么区别?send()
和sendall()
原理是怎么样的?send()
和sendall()
能做什么事情?- 到底是使用
send()
还是sendall()
?
看完下面的文章,应该就能明白了
知识补充
首先会对一些常见的网络编程知识进行补充下:
MTU
通信术语 最大传输单元(Maximum Transmission Unit,MTU
)是指一种通信协议的某一层上面所能通过的最大数据包大小(以字节为单位)
以以太网传送IPv4
报文为例。MTU
表示的长度包含IP包头的长度,如果IP层以上的协议层发送的数据报文的长度超过了MTU
,则在发送者的IP层将对数据报文进行分片,在接收者的IP层对接收到的分片进行重组。
TCP传输的可靠性
应用数据被分割成
TCP
认为最适合发送的数据块(根据MTU
设定)。这和UDP
完全不同,应用程序产生的数据长度将保持不变。由TCP
传递给IP的信息单位称为报文段或段(segment
)。当
TCP
发出一个段后,它启动一个定时器,等待目的端确认收到这个报文段。如果不能及时收到一个确认,将重发这个报文段。当TCP
收到发自TCP
连接另一端的数据,它将发送一个确认。TCP
有延迟确认的功能,在此功能没有打开,则是立即确认。功能打开,则由定时器触发确认时间点。TCP
将保持它首部和数据的检验和。这是一个端到端的检验和,目的是检测数据在传输过程中的任何变化。如果收到段的检验和有差错,TCP
将丢弃这个报文段和不确认收到此报文段(希望发端超时并重发)。既然TCP报文段作为IP数据报来传输,而IP数据报的到达可能会失序,因此
TCP
报文段的到达也可能会失序。如果必要,TCP
将对收到的数据进行重新排序,将收到的数据以正确的顺序交给应用层。既然IP数据报会发生重复,
TCP
的接收端必须丢弃重复的数据。TCP
还能提供流量控制。TCP
连接的每一方都有固定大小的缓冲空间。TCP
的接收端只允许另一端发送接收端缓冲区所能接纳的数据。这将防止较快主机致使较慢主机的缓冲区溢出。
send()
使用send()
进行发送的时候,Python
将内容传递给系统底层的send
接口,也就是说,Python
并不知道这次调用是否会全部发送完成,比如MTU
是1500,但是此次发送的内容是2000,那么除了包头等等其他信息占用,发送的量可能在1000左右,还有1000未发送完毕
但是,send()
不会继续发送剩下的包,因为它只会发送一次,发送成功之后会返回此次发送的字节数,如上例,会返回数字1000给用户,然后就结束了
如果需要将剩下的1000发送完毕,需要用户自行获取返回结果,然后将内容剩下的部分继续调用send()
进行发送
sendall()
sendall()
是对send()
的包装,完成了用户需要手动完成的部分,它会自动判断每次发送的内容量,然后从总内容中删除已发送的部分,将剩下的继续传给send()
进行发送;
源码
send()
是直接调用的系统底层接口,所以Python
源码没有,只有C
的,由于不是很懂C
,所以就没有去找C
源码了
下面的源码是从pypy
中复制出来的
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
|
def send(self, data, flags=0):
"""Send a data string to the socket. For the optional flags
argument, see the Unix manual. Return the number of bytes
sent; this may be less than len(data) if the network is busy."""
with rffi.scoped_nonmovingbuffer(data) as dataptr:
return self.send_raw(dataptr, len(data), flags)
def sendall(self, data, flags=0, signal_checker=None):
"""Send a data string to the socket. For the optional flags
argument, see the Unix manual. This calls send() repeatedly
until all data is sent. If an error occurs, it's impossible
to tell how much data has been sent."""
with rffi.scoped_nonmovingbuffer(data) as dataptr:
remaining = len(data)
p = dataptr
while remaining > 0:
try:
res = self.send_raw(p, remaining, flags)
p = rffi.ptradd(p, res)
remaining -= res
except CSocketError, e:
if e.errno != _c.EINTR:
raise
if signal_checker is not None:
signal_checker()
|
看完此段源码,心中应该对send()
和sendall()
有一些认识了
什么时候使用send()
什么时候使用sendall()
一般情况下,我们都应该使用sendall()
,除非自己弄懂了他们的原理,并且有必要在每次包发送之后进行一些必要的处理,不然我们都不需要去使用send()
,而应该使用已经包装好的sendall()