一、套接字协议及其数据传输特性
关于协议
如果相隔很远的两人想要展开对话,必须先决定对话方式。如果一方使用电话,那么另一方也只能使用电话,而不是书信。可以说,电话就是两人对话的协议。协议是对话中使用的通信规则,把上述概念拓展到计算机领域可整理为”计算机间对话必备通信规则“。
简言之,协议就是为了完成数据交换而定好的约定。
1.1 创建套接字
创建套接字的函数定义如下:
#include<sys/socket.h>
int socket(int domain,int type,int protocol);
//成功时返回文件描述符,失败时返回-1
- domain:套接字中使用的协议族(protocol family)信息
- type:套接字数据传输类型信息
- protocol:计算机间通信中使用的协议信息
1.2 协议族(Protocol Family)
套接字通信中协议有一些分类,通过socket函数的第一个参数传递套接字中使用的协议分类信息。这个协议分类信息称为协议族,可分成如下几类:
名称 | 协议族 |
---|---|
PF_INET | IPv4互联网协议族 |
PF_INET6 | IPv6互联网协议族 |
PF_LOCAL | 本地通信的UNIX协议族 |
PF_PACKET | 底层套接字的协议族 |
PF_IPX | IPX NovelⅡ协议族 |
其中PF_INET对应的IPv4互联网协议族最常用,其他协议族并不常用或者尚未普及。另外,套接字中实际采用的最终协议信息是通过socket函数的第三个参数传递的。在指定的协议族范围内通过第一个参数决定第三个参数。
1.3 套接字类型(Type)
套接字类型指的是套接字的数据传输方式,通过socket函数的第二个参数传递,只有这样才能决定创建的套接字的数据传输方式。我们已经通过第一个参数传递了协议族信息,但是问题在于,决定了协议族并不能同时决定数据传输方式,换言之,socket函数第一个参数PF_INET协议族中也存在多种数据传输方式。接下来一两种具有代表性的数据传输方式为例进行介绍
面向连接的套接字(SOCK_STREAM)
如果向socket函数的第二个参数传递SOCK_STREAM,将创建面向连接的套接字。面向连接的数据传输方式有如下的特点:
- 传输过程中数据不会丢失
- 按序传递数据
- 传输的数据不存在数据边界(Boundary)
不存在数据边界可以通过如下的例子进行理解:“传输数据的计算机通过3次调用write函数传递了100字节的数据,但接收数据的计算机仅通过1次read函数调用就接收了全部100个字节”
收发数据的套接字内部有缓冲(buffer),简言之就是字节数组。通过套接字传输的数据将保存到该数组。因此,收到数据并不意味着马上调用read函数。只要不超过数组容量,则有可能在数据填充满缓冲后通过1次read函数调用读取全部,也有可能分成多次read函数调用进行读取。也就是说,在面向连接的套接字中,read函数和write函数的调用次数并无太大意义。所以说面向连接的套接字不存在数据边界。
面向消息的套接字(SOCK_DGRAM)
如果向socket函数的第二个参数传递SOCK_DGRAM,则将创建面向消息的套接字。这种数据传输方式的特点总结如下:
- 强调快速传输而非传输顺序
- 传输的数据可能丢失也可能损毁
- 传输的数据有数据边界
- 限制每次传输的数据大小
面向消息的套接字比面向连接的套接字具有更快的传输速度,但无法避免数据丢失或损毁。另外,每次传输的数据大小具有一定限制,并存在数据边界。存在数据边界意味着接收数据的此时应和传输次数相同。
此外,面向消息的套接字不存在连接的概念。
1.4 协议的最终选择
接下来介绍下socket函数的第三个参数,该参数决定最终采用的协议。
其实传递前两个参数即可创建所需套接字,所以大部分情况下可以向第三个参数传递0,除非遇到这种情况:“同一协议族中存在多个数据传输方式相同的协议”
数据传输方式相同,但协议不同。此时需要通过第三个参数具体指定协议信息。
假设我们首先创建满足如下要求的套接字:
IPv4协议族中面向连接的套接字
参数PF_INET指IPv4网络协议族,SOCK_STREAM是面向连接的数据传输。满足这两个条件的协议只有IPPROTO_TCP,因此可以如下调用socket函数创建套接字,这种套接字称为TCP套接字:
int tcp_socket=socket(PF_INET,SOCK_STREAM,IPPROTOCO_TCP);
如果我们想创建满足如下要求的套接字:
IPv4协议族中面向消息的套接字
那么参数SOCK_DGRAM指的是面向消息的消息传输房市,满足上述条件的协议只有IPPROTO_UDP。因此,可以如下调用socket函数创建套接字,这种套接字称为UDP套接字:
int udp_socket=socket(PF_INET,SOCK_DGRAM,IPPROTO_UDP);
1.5 面向连接的套接字:TCP套接字示例
这里给出面向连接的TCP套接字示例,目的是为了验证TCP套接字传输的数据不存在数据边界。
为验证这一点,需要让write函数的调用次数不同于read函数的调用次数。因此,在客户端中分多次调用read函数以接收服务器端发送的全部数据。
//tcp_client.c
#include<stdio.h>
void error_handling(char *message);
int main(int argc,char *argv[]){
int sock;
struct sockaddr_in serv_addr;
char message[30];
int str_len=0;
int idx=0, read_len=0;
if(argc!=3){
printf("Usage: %s <IP> <PORT>\n",argv[0]);
exit(1);
}
//如果前两个参数传递PF_INET,SOCK_STREAM,则可以省略第三个参数IPPROTO_TCP
sock=socket(PF_INET,SOCK_STREAM,0);
if(sock==-1)
error_handling("socket() error");
memeset(&serv_addr,0,sizeof(serv_addr));
serv_addr.sin_family=AF_INET;
serv_addr.sin_addr.s_addr=inet_addr(argv[1]);
serv_addr.sin_port=htons(atoi(argv[2]));
if(connect(sock,struct sockaddr*)&serv_addr,sizeof(serv_addr))==-1)
error_handling("connect() error!");
//while循环中反复调用read函数,每次读取一个字节。如果read返回0,则跳出循环
while(read_len=read(sock,&message[idx++],1)){
if(read_len==-1)
error_handling("read() error!");
//执行该语句时,read_len的值始种为1,因此跳出循环后,str_len中存有读取的总字节数
str_len+=read_len;
}
printf("Message from server: %s \n",message);
printf("Function read call count: %d \n",str_len);
close(sock);
return 0;
}
void error_handling(char *message){
}
与该实例配套使用的服务器端tcp_server.c与hello_server.c完全相同,故省略其源代码。执行方式也与hello_server.c和hello_client.c相同,因此只给出最终运行结果:
从运行结果可以看出,服务器端发送了13字节的数据,客户端调用13次read函数进行读取。