深入探讨read write在普通文件和特殊文件中的使用
1普通文件上的read和write:
- read读普通文件,在读到所要求的字节数之前到达了文件尾端,返回值就会小于期望值,再次read会返回0。即read普通文件时,返回值小于期望值是正常行为。
- write写普通文件,返回值小于期望值是一种错误的行为!(原因可能是磁盘已经写满不能再写)
读写普通文件没有阻塞这一说,可以理解为会一次性的读或者一次性的写完。
2 write向套接字写数据(终端、管道等特殊设备也是类似)
假设套接字是阻塞的,这是他的默认设置,那么当套接字的缓冲区容不下应用进程要写的数据的时候(例如应用进程的代写缓冲区大于套接字的发送缓冲区),write将一直阻塞,直到进程把数据全部写进套接字。(如果套接字为非阻塞的,write会立即返回,返回值是写入的数据量)。
这里套接字缓冲区已满完全不像磁盘已满(写普通文件时出错的原因之一),并不是一种出错,所以不会立即返回。
不考虑套接字是非阻塞时,write返回值小于所期望的值是一种出错行为(最大的原因是阻塞时被信号打断)。
UNP上说,尽管这样,为了预防万一,以及考虑到信号的打断,以及不让实现返回一个不足字节计数值,在套接字编程中,我们还是用writen取代write。
3 read从套接字读数据(终端、管道等特殊设备也是类似)
即使套接字是阻塞的(默认设置),当read一个套接字的时候,经常会出现返回值比所请求的数据量少。原因可能是read已经读完套接字缓冲区,其余的数据尚未到来。这时我们需要继续调用read(如果这时数据还没到达缓冲区,则read会阻塞,也就是说如果网络上没有接收到数据包,调用read会阻塞),直到读到我们所需的数据量为止(数据可能会陆续到来,所以以后调用的read返回值可能还会小于期望值)。这就就是readn的原理。
read返回值小于所期望的值是一种正常现象。
只有当对端关闭连接的时候,read才会返回0!!!!(也会先把缓冲区的数据读完,再次读才会返回0)
补充:在read普通文件的时候,读完文件后再次调用read会返回0。而在读特殊类型的文件的时候(管道、终端、网络设备等),如果数据不存在,可能会使调用者永远阻塞。(这是因为这些类型的文件没有普通文件的“读完”这个概念,所以不会返回0)
也就是说,read普通类型的文件和特殊类型的文件:
- 相同点:都会存在返回值比所请求的数据量小,原因都是“读完了数据”。
- 不同点:普通文件读完了数据就是真的到了文件末尾,再次read会返回0。而对特殊文件来讲,“读完了数据”意味着缓冲区中暂时没有数据!所以再次调用read,如果数据还没有到来,那么read操作会阻塞,如果数据到来了,到来的数据又小于所要求的数目,那么会继续返回真实读到的数据。如此以往,就可以封装成readn。