Linux 套接字编程——帮你捋一捋

最新推荐文章于 2024-01-03 16:49:58 发布

随风之影

最新推荐文章于 2024-01-03 16:49:58 发布

阅读量616

点赞数

分类专栏：经验总结文章标签： linux socket 网络字节序地址结构 api

本文链接：https://blog.csdn.net/xuziqu/article/details/46764193

版权

经验总结专栏收录该内容

23 篇文章 0 订阅

订阅专栏

小编在学习套接字编程的过程中，经常碰到几个套接字地址类型，包括sockaddr、sockaddr_in、sockaddr_un，其中

sockaddr表示通用的套接字地址，是linux 网络通信的地址结构体的一种

sockaddr_in则是internet环境下套接字的地址形式，能够快速获取套接字地址的每一个字段

sockaddr_un是针对UNIX域套接字地址，是UNIX环境下套接字的地址形式。

其中，sockaddr的结构如下：

struct sockaddr {
unsigned  short  sa_family;     /* address family, AF_xxx */
char  sa_data[14];                 /* 14 bytes of protocol address */
};

sa_family是地址家族，一般都是“AF_xxx”的形式。好像通常大多用的是都是AF_INET。
sa_data是14字节协议地址。

显然该结构体的大小为2+14=16 Byte

sockaddr_in的结构如下：

struct  sockaddr_in {
short  int  sin_family;                      /* Address family */
unsigned  short  int  sin_port;       /* Port number */
struct  in_addr  sin_addr;              /* Internet address */
unsigned  char  sin_zero[8];         /* Same size as struct sockaddr */
};

sin_family指代协议族，在socket编程中只能是AF_INET
sin_port存储端口号（使用网络字节顺序）
sin_addr存储IP地址，使用in_addr这个数据结构
sin_zero是为了让sockaddr与sockaddr_in两个数据结构保持大小相同而保留的空字节。
s_addr按照网络字节顺序存储IP地址

其中，in_addr的结构如下：

struct  in_addr {
unsigned  long  s_addr;
};

typedef struct in_addr {
union {
            struct{
                        unsigned char s_b1,
                        s_b2,
                        s_b3,
                        s_b4;
                        } S_un_b;
           struct {
                        unsigned short s_w1,
                        s_w2;
                        } S_un_w;
            unsigned long S_addr;
          } S_un;
} IN_ADDR;

这里的in_addr是一个联合体结构，可以通过相应的字段获取不同粒度的数据，其中S_un_b可以看作是以Byte为粒度大小，包含了4个Byte，而S_un_w可以看作是以Word为粒度大小，包含了2个Word，而S_addr则是完整的8Byte 32Bit的IP地址表示。

显然该结构的大小为2+2+4+8=16 Byte

sockaddr_un的结构如下：

struct socketaddr_un
{
_SOCKADDR_COMMON(sun_);  // __SOCKADDR_COMMON(sun_) 宏定义对应的定义为 sa_family_t sun_family
Char sun_path[108];
};

这是一种通用的定义，一般都不用。使用UNIX套接字作为进程间通信的一种方式，通常使用的往往不是网络套接字，而是一种称为本地套接字的方式。该地址结构就是用来表示本地套接字的结构，其中sun_path用来表示本地地址，通常是/tmp

除了上述的多种地址之外，还有一些需要注意的地方，就是网络字节序，我们知道在不同的计算机体系结构中，相同的数据可能存在不同的存储方式，也就是常说的大端和小端问题，而网络字节序则是大端方式，除了Byte之间的存储存在大小端问题之外，Bit之间也存在大小端问题，在计算机的存储中，Bit的大小端方式和Byte的大小端方式是保持一致的，也就说，对于大端方式而言，高位的Byte存放在低地址，而地位的Byte存放在高地址，同样一个Byte中的高位Bit也是存放在低位地址，而低位Bit则是存放在高位地址，小端方式则采用相似但相反的方式。

但是对于网络字节序而言，存在线地址一说，这个线地址就类似于内存中的物理地址，只不过在进行数据传输的时候，低位线地址一定优先于高位线地址进行传输，那么对于采用大端方式的网络字节序而言，高位Byte一定是存放在低位线地址，而低位Byte则是存放在高位线地址，但是对于同一个Byte的Bit而言情况就和计算机的存储不一样了，对于网络字节序而言，一个Byte的不同Bit的存储则是采用了相反的方式进行存储，也就是说采用的是小端的方式。换句话说，同一个Byte的高位Bit其实是存放在高位线地址，而低位的Bit则是存放在低位Bit，也就是说，低位的Bit比高位的Bit得到优先传输，这个转换是由NIC（Network Interface Card）来完成的。

具体的大小端说明，有具体的传送门：http://blog.csdn.net/hanhuili/article/details/7185836和http://www.linuxjournal.com/article/6788

此外，除了上述的一些基础问题，还有一些应用性问题值得注意：

在套接字编程过程中，对于一些可能存在的隐患问题需要注意：

其一：不要忽略每一个套接字编程API的返回值，因为有可能程序在某一个地方只运行成功了一部分，而出现问题的地方被程序猿忽略，导致bug不可寻。

其二：不要对帧做出同步假设，这是UDP和TCP的差异，其中，UDP能够保持消息报文的边界，而TCP则不对边界做出界定。

这里提供一个传送门：http://www.ibm.com/developerworks/cn/linux/l-sockpit/

还有一些就是常用的套接字API，用于网络字节序的转换：

1、ntohs、ntohl表示Network to Host

2、htons、htonl表示Host to Network

3、inet_addr表示将一个点分十进制的IP转换成一个长整数型数，此时已经是网络字节序

4、inet_ntoa表示Network to ASCII

以上就是关于网络套接字编程需要注意的一些地方。