Linux 套接字编程——帮你捋一捋

小编在学习套接字编程的过程中,经常碰到几个套接字地址类型,包括sockaddr、sockaddr_in、sockaddr_un,其中

sockaddr表示通用的套接字地址,是linux 网络通信的地址结构体的一种

sockaddr_in则是internet环境下套接字的地址形式,能够快速获取套接字地址的每一个字段

sockaddr_un是针对UNIX域套接字地址,是UNIX环境下套接字的地址形式。


其中,sockaddr的结构如下:

struct sockaddr {
unsigned  short  sa_family;     /* address family, AF_xxx */
char  sa_data[14];                 /* 14 bytes of protocol address */
};

sa_family是地址家族,一般都是“AF_xxx”的形式。好像通常大多用的是都是AF_INET。
sa_data是14字节协议地址。

显然该结构体的大小为2+14=16 Byte


sockaddr_in的结构如下:

struct  sockaddr_in {
short  int  sin_family;                      /* Address family */
unsigned  short  int  sin_port;       /* Port number */
struct  in_addr  sin_addr;              /* Internet address */
unsigned  char  sin_zero[8];         /* Same size as struct sockaddr */
};

sin_family指代协议族,在socket编程中只能是AF_INET
sin_port存储端口号(使用网络字节顺序)
sin_addr存储IP地址,使用in_addr这个数据结构
sin_zero是为了让sockaddr与sockaddr_in两个数据结构保持大小相同而保留的空字节。
s_addr按照网络字节顺序存储IP地址


其中,in_addr的结构如下:

struct  in_addr {
unsigned  long  s_addr;
};

typedef struct in_addr {
union {
            struct{
                        unsigned char s_b1,
                        s_b2,
                        s_b3,
                        s_b4;
                        } S_un_b;
           struct {
                        unsigned short s_w1,
                        s_w2;
                        } S_un_w;
            unsigned long S_addr;
          } S_un;
} IN_ADDR;
这里的in_addr是一个联合体结构,可以通过相应的字段获取不同粒度的数据,其中S_un_b可以看作是以Byte为粒度大小,包含了4个Byte,而S_un_w可以看作是以Word为粒度大小,包含了2个Word,而S_addr则是完整的8Byte 32Bit的IP地址表示。

显然该结构的大小为2+2+4+8=16 Byte


sockaddr_un的结构如下:

struct socketaddr_un
{
_SOCKADDR_COMMON(sun_);  // __SOCKADDR_COMMON(sun_) 宏定义对应的定义为 sa_family_t sun_family
Char sun_path[108];
};

这是一种通用的定义,一般都不用。使用UNIX套接字作为进程间通信的一种方式,通常使用的往往不是网络套接字,而是一种称为本地套接字的方式。该地址结构就是用来表示本地套接字的结构,其中sun_path用来表示本地地址,通常是/tmp


除了上述的多种地址之外,还有一些需要注意的地方,就是网络字节序,我们知道在不同的计算机体系结构中,相同的数据可能存在不同的存储方式,也就是常说的大端和小端问题,而网络字节序则是大端方式,除了Byte之间的存储存在大小端问题之外,Bit之间也存在大小端问题,在计算机的存储中,Bit的大小端方式和Byte的大小端方式是保持一致的,也就说,对于大端方式而言,高位的Byte存放在低地址,而地位的Byte存放在高地址,同样一个Byte中的高位Bit也是存放在低位地址,而低位Bit则是存放在高位地址,小端方式则采用相似但相反的方式。

但是对于网络字节序而言,存在线地址一说,这个线地址就类似于内存中的物理地址,只不过在进行数据传输的时候,低位线地址一定优先于高位线地址进行传输,那么对于采用大端方式的网络字节序而言,高位Byte一定是存放在低位线地址,而低位Byte则是存放在高位线地址,但是对于同一个Byte的Bit而言情况就和计算机的存储不一样了,对于网络字节序而言,一个Byte的不同Bit的存储则是采用了相反的方式进行存储,也就是说采用的是小端的方式。换句话说,同一个Byte的高位Bit其实是存放在高位线地址,而低位的Bit则是存放在低位Bit,也就是说,低位的Bit比高位的Bit得到优先传输,这个转换是由NIC(Network Interface Card)来完成的。

具体的大小端说明,有具体的传送门:http://blog.csdn.net/hanhuili/article/details/7185836http://www.linuxjournal.com/article/6788


此外,除了上述的一些基础问题,还有一些应用性问题值得注意:

在套接字编程过程中,对于一些可能存在的隐患问题需要注意:

其一:不要忽略每一个套接字编程API的返回值,因为有可能程序在某一个地方只运行成功了一部分,而出现问题的地方被程序猿忽略,导致bug不可寻。

其二:不要对帧做出同步假设,这是UDP和TCP的差异,其中,UDP能够保持消息报文的边界,而TCP则不对边界做出界定。

这里提供一个传送门:http://www.ibm.com/developerworks/cn/linux/l-sockpit/


还有一些就是常用的套接字API,用于网络字节序的转换:

1、ntohs、ntohl表示Network to Host

2、htons、htonl表示Host to Network

3、inet_addr表示将一个点分十进制的IP转换成一个长整数型数,此时已经是网络字节序

4、inet_ntoa表示Network to ASCII


以上就是关于网络套接字编程需要注意的一些地方。


  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值