关于套接字(socket)的理解
不同计算机(通过网络相连)上运行的进程相互通信机制称为网络进程间通信(network IPC)。
在本地可以通过进程PID来唯一标识一个进程,但是在网络中这是行不通的。其实TCP/IP协议族已经帮我们解决了这个问题,网络层的“ip地址”可以唯一标识网络中的主机,而传输层的“协议+端口”可以唯一标识主机中的应用程序(进程)。这样利用三元组(ip地址,协议,端口)构成套接字,就可以标识网络的进程了,网络中的进程通信就可以利用这个标志与其它进程进行交互。
套接字是通信端口的抽象!通过套接字网络IPC接口,进程能够使用该接口和其他进程通信。
套接字描述符
套接字是端点的抽象。与应用进程要使用文件描述符访问文件一样,访问套接字也需要用套接字描述符。套接字描述符在UNIX系统中是用文件描述符实现的。
要创建一个套接字,可以调用socket函数。
#include<sys/socket.h>
int socket(int domain, int type, int protocol);
//作用:socket()用于创建一个socket描述符(socket descriptor),它唯一标识一个socket。
网络字节序
网络协议指定了字节序,因此异构计算机系统能够交换协议信息而不会混淆字节序。TCP/IP协议栈采用大端字节序。应用进程交换格式化数据时,字节序问题就会出现。对于TCP/IP,地址用网络字节序来表示,所以应用进程有时需要在处理器的字节序与网络字节序之间转换。
#include<arpa/inet.h>
uint32_t htonl(uint32_t hostlong);
uint16_t htons(uint16_t hostshort);
uint32_t ntohl(uint32_t netlong);
uint16_t ntohs(uint16_t netshort);
这些函数名很好记,h表示host,n表示network, l表示32位长整数,s表示16位短整数
在将一个地址绑定到socket的时候,请先将主机字节序转换成为网络字节序,对主机字节序不要做任何假定,务必将其转化为网络字节序再赋给socket!
将套接字与地址绑定
与客户端的套接字关联的地址意义不大,可以让系统选择一个默认的地址。然而,对于服务器,需要给一个接收客户端请求的套接字绑定一个众所周知的地址。客户端应有一种方法用以连接服务器的地址,最简单的方法就是为服务器保留一个地址并且在/etc/services或某个名字服务(name service)中注册。
可以用bind函数来搞定这个问题:
#include <sys/types.h>
#include <sys/socket.h>
int bind(int sockfd, const struct sockaddr *addr, socklen_t addrlen);
参数:
第一个参数:bind()函数把一个地址族中的特定地址赋给该sockfd(套接字描述字)。例如对应AF_INET、AF_INET6就是把一个ipv4或ipv6地址和端口号组合赋给socket。
第二个参数:struct sockaddr *指针,指向要绑定给sockfd的协议地址。这个地址结构根据地址创建socket时的地址协议族的不同而不同:
点分十进制IP与网络字节序IP之间的转换
有时需要打印出能被人而不是计算机所理解的地址格式。我们可以利用函数来进行二进制地址格式与点分十进制格式的相互转换。但是这些函数仅支持IPv4地址。
#include <sys/socket.h>
#include <netinet/in.h>
#include <arpa/inet.h>
//点分十进制IP转换网络字节序IP
int inet_aton(const char *cp, struct in_addr *inp);
//点分十进制IP转换网络字节序IP
in_addr_t inet_addr(const char *cp);
//网络字节序IP 转化点分十进制IP
char *inet_ntoa(struct in_addr in);
//其中inet_pton和inet_ntop不仅可以转换IPv4的in_addr,还可以转换IPv6的in6_addr,因此函数接口是void* 类型!
#include <arpa/inet.h>
//网络字节序IP 转化点分十进制IP
const char *inet_ntop(int af, const void *src,char *dst, socklen_t size);
//点分十进制IP转换网络字节序IP
int inet_pton(int af, const char *src, void *dst);
监听
如果作为一个服务器,在调用socket()、bind()之后就会调用listen()来监听这个socket,如果客户端这时调用connect()发出连接请求,服务器端就会接收到这个请求。
服务器调用 listen 来宣告可以接收连接请求!
#include <sys/types.h>
#include <sys/socket.h>
int listen(int sockfd, int backlog);
//参数:sockfd为要监听的socket描述字,backlog为相应socket可以排队的最大连接个数
//返回值:成功返回0,出错返回-1
作用:socket函数创建一个套接字时,默认是一个主动套接字,listen函数把一个未调用connect的未连接的套接字转换成一个被动套接字,指示内核应接收指向该套接字的连接请求。(主动/客户 -> 被动/服务器)
连接
如果是面向连接的网络服务,在开始交换数据前,都要在请求服务的进程套接字(客户端)和提供服务的进程套接字(服务器)之间建立一个连接,使用connect函数:
#include <sys/types.h>
#include <sys/socket.h>
int connect(int sockfd, const struct sockaddr *addr, socklen_t addrlen);
//参数:第一个参数sockfd为客户端的socket描述字,第二参数为服务器的socket地址,第三个参数为socket地址的长度。
//返回值:成功返回0,出错返回-1
作用:客户端通过调用connect函数来建立与TCP服务器的连接,此时进行tcp的三次握手。
注意:在connect中所指定的地址是想与之通信的服务器地址。如果sockfd没有绑定到一个地址,connect会给调用者绑定一个默认地址!
使用accept函数获得连接请求并建立连接
#include <sys/types.h>
#include <sys/socket.h>
int accept(int sockfd, struct sockaddr *addr, socklen_t *addrlen);
//参 数 :第一个参数为服务器的socket描述字,第二个参数为指向struct sockaddr *的指针,用于返回客户端的协议地址,第三个参数为协议地址的长度
返回值:如果accpet成功,那么其返回值是由内核自动生成的一个全新的描述符,该描述符连接到调用connect的客户端。这个新的套接字描述符和原始的套接字描述符具有相同的套接字类型和地址族。
注 意:传给accept的原始套接字没有关联到这个连接,而是继续保持可用状态并接受其它连接请求!
通俗点来说,accept的第一个参数为服务器的socket描述字,是服务器开始调用socket()函数生成的,称为监听socket描述字;而accept函数返回的是已连接的socket描述字。一个服务器通常通常仅仅只创建一个监听socket描述字,它在该服务器的生命周期内一直存在。内核为每个由服务器进程接受的客户连接创建了一个已连接socket描述字,当服务器完成了对某个客户的服务,相应的已连接socket描述字就被关闭。
数据传输
既然套接字端点表示文件描述符,那么只要建立连接,就可以使用write和read来通过套接字通信了。
#include <unistd.h>
ssize_t write(int fd, const void *buf, size_t count);
ssize_t read(int fd, void *buf, size_t count);
write()会把指针buf所指的内存写入count个字节到参数fd所指的文件内(文件读写位置也会随之移动),如果顺利write()会返回实际写入的字节数。当有错误发生时则返回-1,错误代码存入errno中!
read()会把参数fd所指的文件传送nbyte个字节到buf指针所指的内存中,成功返回读取的字节数,出错返回-1并设置errno,如果在调read之前已到达文件末尾,则这次read返回0 。
如果想指定多个选项、从多个客户端接收数据包或发送带外数据,需要采用6个传递数据的套接字函数中的一个。
- 三个函数用来发送数据:
#include <sys/types.h>
#include <sys/socket.h>
ssize_t send(int sockfd, const void *buf, size_t len, int flags);
ssize_t sendto(int sockfd, const void *buf, size_t len, int flags,const struct sockaddr *dest_addr, socklen_t addrlen);
ssize_t sendmsg(int sockfd, const struct msghdr *msg, int flags);
sendto()适用于已连接的数据报或流式套接口发送数据。
参数:
sockfd:一个标识套接口的描述字。
buf:包含待发送数据的缓冲区。
len:buf缓冲区中数据的长度。
flags:调用方式标志位。
dest_addr:(可选)指针,指向目的套接口的地址。
addrlen:所指地址的长度。
- 三个函数用来接收数据:
#include <sys/types.h>
#include <sys/socket.h>
ssize_t recv(int sockfd, void *buf, size_t len, int flags);
ssize_t recvfrom(int sockfd, void *buf, size_t len, int flags, struct sockaddr *src_addr, socklen_t *addrlen);
ssize_t recvmsg(int sockfd, struct msghdr *msg, int flags);
recvfrom()函数用于从已连接的套接口上接收数据,并捕获数据发送源的地址。
参数:
sockfd:用来标识一个已连接套接口的描述字;
buf:接收数据缓冲区;
len:缓冲区长度;
flags:调用操作方式,一般情况下为0;
src_addr:指向装有源地址缓冲区的指针;
关闭套接字描述符
close函数用来关闭文件描述符:
#include <unistd.h>
int close(int fd);
//注意:close操作只是使相应socket描述字的引用计数-1,只有当引用计数为0的时候,才会触发TCP客户端向服务器发送终止连接请求。