Socket是一组接口,是应用层与TCP/IP协议族通信的中间软件抽象层。
对于开发者的我们socket就是一组接口,而本质上他把复杂的TCP/IP协议族隐藏在接口后面,让socket根据指定协议组织数据。
套接字结构或者说套接字数据结构,是指底层实现TCP/IP的数据结构集,它包括:
1.该套接字所关联的本地和远程互联网地址和端口
2.一个FIFO队列(RecvQ)用于存放接收到的等待分配的数据,一个用于存放待传输数据的队列(SendQ)
3.对于TCP套接字,还包含了与TCP握手相关的额外协议状态信息
TCP协议本身是一种可信赖的字节流服务,任何写入Socket输出流的数据副本必须保留在本地缓冲区,直到另一端成功接收。向输出流写入信息只是说被复制到了本地缓冲区,并不意味着数据实际上已经发送。就算调用flush方法也不能保证能立即发送到信道
从一端写入数据和在另一端从输入流读出数据之间并不存在必然的一致性。一次write()可能需要多次read(),而一次read()可以返回多次write()写入的内容。
接收端对传输过来的字节的分组方式,取决于read和write调用的时间差,以及提供给in.read的缓冲区大小,缓冲区大小的限制好理解,关于read和write的时间差,写一个代码测试一下
server:
ServerSocket server = new ServerSocket(5800);
Socket socket = server.accept();
Thread.currentThread().sleep(4);
InputStream is = socket.getInputStream();
while(true)
{
byte[] bytes = new byte[100];
is.read(bytes);
System.out.println(new String(bytes));
}
client:
Socket socket = new Socket("localhost", 5800);
OutputStream os = socket.getOutputStream();
byte[] bytes = new byte[100];
for(int i=0;i<100;i++)
{
os.write(20+i);
bytes[i] = (byte)i;
}
这里在server的获得socket对象和read之间让server阻塞4毫秒打印出来的结果是: !"#$%&'()*+,-./0123456789:;<=>?@ABCDEFGHIJKLMNOPQRSTUVWXYZ[\]^_`abcdefghijklmnopqrstuvw
也就是说client分100次write,server一次read完了
而把sleep那行代码注释掉的话就会不规则分成多组读取
具体原因:
我们可以认为tcp连接上发送的字节序在某一瞬间分成了3个FIFO序列:
1.sendQ:发送端底层实现缓存,里面存放的是还没发送或发送了对方还没收到(为了防止网络异常重发)的字节。write()本质上就是向sendQ追加字节。sendQ想RecvQ是以块(chunk)的形式传输,chunk大小与write写入字节长度无关
2.RecvQ:接收端底层实现的缓存,等待read读取
3.Delivered:接受从输入流中读取到的字节应该就是内存了,从RecvQ读取数据时,字节从RecvQ发送到delivered中,chunk的大小和RecvQ中字节长度和read(buf)中buf的大小有关