1.套接字的概念
所谓的socket通常也称做套接字,用于描述IP地址和端口号,是一个通信链的句柄。
应用程序通常通过“套接字”向网络发起请求或应答,应用程序一般仅在同一类套接字间进行通信
在TCP/IP协议中,“IP地址+TCP或UDP端口号”唯一标识一个网络通讯中的一个进程。
在TCP协议中,建立连接的俩个进程各自由一个socket来标识,那么这俩个socket组成的socket pair就唯一标识一个连接
端口号
端口号:端口号为2字节,16位的整数。用来标识一个进程,告诉操作系统,当前数据交给哪个进程处理。一个端口号只能被一个进程占用。
计算机的端口号port,可以认为是计算机与外界交交流的出口
端口号分类:
1)公认端口:0~1023,他们紧密绑定与一些服务,通常这些端口的通讯表明了某种服务的协议。(80号端口HTTP )
2)注册端口:1024~49151,松散的绑定与一些服务
3)动态/私有端口:49152~65535
分辨套接字(ip+port)和进程id
注:为什么有pid标识进程,还需要套接字?
pid在程序每次运行时都会改变,而套接字可以唯一的标识一个进程。套接字就相当于10086,而pid相当于10086的客服,你拨打10086标识着移动,但是客服每次都不一样。
套接字分为:流套接字和数据报套接字
2.网络字节序
计算机存储数据时是分大端和小端的,而且主机与主机之间的存储模式是不固定的。也就是没有统一的标准。即如果你是大端,模式,而对端是小端模式,你们在交换数据时就是发生错误,所以为了避免差异化,TCP/IP协议规定网络数据流都要采用大端序,及低地址存放数据的高字节
无论主机是大端序还是小端序,是发送端还是接受端,都要按照TCP/IP协议规定的网络字节序来处理数据。如果主机是小端序则转化为大端序,否则就忽略,直接发送即可
字节序转换函数
#include<arpa/inet.h>
//主机序转网络序
uint32_t htonl(uint32_t hostlong)
uint16_t htons(uint16_t hostshort)
//网络序转主机序
uint32_t ntohl(uint32_t hostlong)
uint16_t ntohs(uint16_t hostshort)
h表示host,n表示network。l表示32位长整型,是表示16位短整型
如果主机是小端序,则函数内部会转换成大端序,如果主机是大端序,则含糊内部不做转换
3.套接字地址结构体
sockaddr数据结构:
sockaddr
struct sockaddr{
unsigned short sa_family;//2字节的地址家族,一般都是“AF_xxx”,通常用AF_INET
char sa_data[14];//14字节的地址数据
}
sockaddr_in
struct sockaddr_in{
short int sin_family;
unsigned short int sin_port;
struct in_addr sin_addr;
unsigned char sin_zero[8];
}
//sin_family:代指协议族,在socket编程中。只能是AF_INET
//sin_port:存储端口号(使用网络字节序)
//sin_addr:存储IP地址,使用in_addr这个数据结构
//sin_zero:是为了让sockaddr与sockaddr_in两个结构体保持大小相同而保留的空字节
sockaddr_in中的in_addr
typedef struct in_addr
{
union{
struct { unsigned char s_b1,s_b2,s_b3,s_b4;} S_un_b;
struct { unsigned short s_w1,s_w2;} S_un_w;
unsigned long S_addr;
}S_un;
}IN_ADDR
socket API是一层抽象的网络编程接口,适用于各种底层网络协议,ipv4,ipv6等,然而各种网络协议的地址并不同,所以我们要将使用的各种地址强转为sockaddr类型,sockaddr用于存储参与套接字通信的一个计算机上的IP协议地址
ipv4地址为struct sockaddr_in包括16位端口号,32位IP地址号,还有16位地址类型
ipv4:AF_INET
ipv6:AF_INET6
UNIX Domain Sock:AF_UNXI
每种socket的地址结构体虽不大相同,但其开头16位表明了其类型,所以只要取socket结构体的首地址,就可以知道根据地址类型字段确定结构体的内容。因此,socket API可以接受各种类型的sockaddr结构体指针做参数,本来可将socket API中地址字段设计位void* 类型,但是socket API的实现早于ANSIC,那时候还没有void*类型,因此这些函数的参数都用struct sockaddr *表示,但是传参时需要强转
3.套接字编程相关函数
1)socket函数
函数功能:创建socket文件描述符
函数原型:
int socket(int domain,int type,int protocol)
适用协议:TCP/UDP 服务器+客户端
返回值:成功返回对应的套接字描述符,失败返回-1
参数说明:socket返回描述符,后续的操作都是基于该描述符进行的
a)domain
ipv4: AF_INET
ipv6:AF_INET6
UNIX:AF_UNIX
未指定:AF_UNSPEC
b)type
SOCK_STREAM 有序,可靠的,双向的,面向连接,面向字节流套接字
SOCK_DGRAM 长度固定的,无连接的,不可靠,面向数据报的套接字
SOCK_RAW 原始套接字
c)protocol
0 默认协议(一般选用)
IPPROTO_TCP TCP传输协议
IPPROTO_UDP UDP传输协议
2)bind函数
调用函数socket()创建套接字描述符时,该套接字描述符存储在其协议簇空间里的,没有具体的地址,要使它与一个地址相关联,可以使用bind()函数使其与地址绑定,客户端的套接字关联的地址一般可由系统分配,因此不需要指定具体的地址。若要为服务器绑定地址,可以通过调用函数bind()将套接字绑定到一个地址
函数功能:将协议地址绑定到一个套接字,其中协议地址包括IP地址+端口号
注:一个端口号只能绑定一个进程,但父子进程可绑定同一个port
函数原型:
int bind(int socket, const struct sockaddr *address,socklen_t adddreaa_len)
返回值:成功返回0,失败返回-1
适用协议:TCP/UDP 服务器
参数说明:
socket为套接字描述符
address是指向一个特定的协议的结构体指针
address_len是地址结构的长度
对于TCP协议,调用bind()函数可以指定一个端口号,或者指定一个IP地址,也可以两者都指定,或都不指定
1)服务器在启动时会绑定众所周知的端口号,如果一个TCP的客户端或服务器没有调用bind()捆绑一个端口,当调用connect或listen时,内核就要为相应的套接字选择一个临时端口。
对于TCP客户端来说,让内核选择临时端口时正常的,除非应用需要绑定预留端口。然而服务器一般都会选用一个众所周知的端口号使大家认识
2)进程可以把一个特定的IP地址捆绑到他的套接字上,不过这个IP地址必须属于其主机所在的网络接口之一,对于TCP客户,这就为该套接字上发送的IP数据报加上了源IP地址,对于TCP服务器来说,这就限定该套接字只接受那些目的地为这个IP地址的客户连接,TCP客户端通常并不把IP地址绑定到其套接字上。如果TCP服务器没有将IP地址绑定到它的套接字上,内核就会把客户端发送的SYN的目的IP地址作为服务器的源IP地址
3)listen()函数
函数功能:接受请求连接,服务器进程不知道要与谁建立连接,因此它不会主动要求与某个进程连接,只是一直监听,看是否有客户端进程与之连接,然后响应该连接请求,并作出处理,一个服务器进程可以同时和多个客户端进程进行连接
函数原型:
int listen(int socket,inttbscklog);
适用协议:TCP 服务器
返回值:成功返回0,失败返回-1
参数说明:
socket:套接字描述符。
inttbscklog:该进程允许保持连接的最大个数
为了理解inttbscklog参数,我们必须认识到内核为任何一个给定的监听套接字俩个队列
1.未完成连接队列,每个这样的SYN分节对应其中一项:已由某个客户端发送并到达服务器,而服务器正在等待完成相应的TCP三次握手过程,这些套接字处于SYN_RECV阶段
2.已完成连接队列:已完成三次握手
4)accept()函数
函数功能:从已完成连接队列的头返回下一个已完成连接,若已完成队列为空,则进程进入睡眠状态
函数原型:
int accept(int socket,struct sockaddr* address,socklen_t *address_len)
适用协议:TCP 服务器
返回值:成功返回新的套接字描述符,失败返回-1
参数说明:
socket服务器监听套接字描述符,一个服务器通常仅仅建立一个套接字描述符,他在该服务器的生命周期内一直存在。内核为每个由服务器进程接受的客户连接创建一个已连接套接字(表示 TCP 三次握手已完成),当服务器完成对某个给定客户的服务时,相应的已连接套接字就会被关闭
address和address_len 是对端的(即客户端的)协议地址(ip,端口号)
5)connect()函数
函数功能:建立连接,客户端使用该函数和服务器建立连接
函数原型
int connect(int sockfd,const struct sockaddr* addr,socklen_t addrlen);
使用协议:TCP 客户端
函数返回值:成功返回0,失败返回-1
参数说明:
sockfd:系统调用的套接字描述符,socket的返回值
addr:目的(服务器)套接字的地址(目的IP地址,目的端口号)
addrlen:目的套接字地址的大小
通信过程