参考
- 《TCP/IP网络编程》 尹圣雨
分配给套接字的IP地址与端口号
IP是Internet Protocol(网络协议)的简写,是为收发网络数据而分配给计算机的值。端口号并非赋予计算机的值,而是为区分程序中创建的套接字而分配套接字的序号
网络地址(Internet Address)
IP地址分为两类:
(1)IPv4(Internet Protocol version 4):4字节地址族
(2)IPv6(Internet Protocol version 6):16字节地址族
现在还是主要使用IPv4,IPv6的普及将需要更长时间。
IPv4标准的4字节IP地址分为网络地址和主机(指计算机)地址,且分为A、B、C、D、E等类型。网络地址(网络ID)是为区分网络而设置的一部分IP地址。所以,“向相应网络传输数据”实际上是向构成网络的路由器(Router)或交换机(Switch)传递数据,由接收数据的路由器根据数据中的主机地址向目标主机传递数据
端口号
计算机中一般配有NIC(Network Interface Card,网络接口卡)数据传输设备。通过NIC向计算机内部传输数据时会用到IP。操作系统负责把传递到内部的数据适当分配给套接字,这时就要利用端口号。即,通过NIC接收的数据内由端口号,操作系统参考此端口号把数据传输给相应端口的套接字
无法将1个端口号分配给不同的套接字。另外,端口号由16位构成,可分配的端口号范围是0-65535。但0-1023是知名端口(Well-known PORT),一般分配给特定应用程序
虽然端口号不能重复,但TCP套接字和UDP套接字不会共用端口号,所以允许重复
地址信息的表示
表示IPv4地址的结构体
struct sockaddr_in
{
sa_family_t sin_family; // 地址族(Address Family)
unit16_t sin_port; // 16位TCP/UDP端口号
struct in_addr sin_addr; // 32位IP地址
char sin_zero[8]; // 不使用
};
其中,in_addr定义如下
struct in_addr
{
in_addr_t s_addr; // 32位IPv4地址
};
里面存在大量额外定义的数据类型。可以参考POSIX(Portable Operating System Interface,可移植操作系统接口)。POSIX是为UNIX系列操作系统设立的标准
POSIX中定义的数据类型:
(1)sys/types.h头文件
-
int8_t:signed 8-bit int
-
uint8_t:unsigned 8-bit int (unsigned char)
-
int16_t:signed 16-bit int
-
uint16_t:unsigned 16-bit int (unsigned short)
-
int32_t:signed 32-bit int
-
uint32_t:unsigned 32-bit int (unsigned long)
(2)sys/socket.h
-
sa_family_t:地址族(address family)
-
socklen_t:长度(length of struct)
(3)netinet/in.h
-
in_addr_t:IP地址,声明为uint32_t
-
in_port_t:端口号,声明为uint16_t
之所以额外定义这些数据类型,是考虑到扩展性。例如,如果使用int32_t类型的数据,就能保证在任何时候都占用4字节,即使将来用64位表示int类型
结构体sockaddr_in的成员
(1)sin_family
每种协议族适用的地址族均不同。比如,IPv4使用4字节地址族,IPv6使用16字节地址族
-
AF_INET:IPv4网络协议中使用的地址族
-
AF_INET6:IPv6网络协议中使用的地址族
-
AF_LOCAL:本地通信中采用的UNIX协议的地址族
(2)sin_port
以网络字节序保存16位端口号
(3)sin_addr
以网络字节序保存32位IP地址信息。本质上为32位整型数
(4)sin_zero
无特殊含义。只是为使结构体sockaddr_in的大小与sockaddr结构体保持一致而插入的成员。必须填充为0
实际上,bind函数的第二个参数期望得到的是sockaddr结构体变量地址值。而sockaddr结构体的定义如下:
struct sockaddr
{
sa_family_t sin_family; // 地址族
sa_data[14]; // 地址信息
};
其中,sa_data保存的地址信息中需包含IP地址和端口号,剩余部分应填充0。而这对于包含地址信息来讲非常麻烦,继而有了新的结构体sockaddr_in,二者内存大小相同,只是sockaddr_in填写信息更方便
另外,由于sockaddr并非只为IPv4设计,因此,结构体要求在sin_family中指定地址族信息。为了与sockaddr一致,sockaddr_in结构体中也有地址族的信息,尽管sockaddr_in只用于保存IPv4地址信息
网络字节序与地址变换
字节序与网络字节序
CPU向内存保存数据的方式有2种,这意味着CPU解析数据的方式也有2种:
- 大端序(Big Endian):高位字节存放到低位地址
- 小端序(Little Endian):高位字节存放到高位地址
主机字节序(Host Byte Order)在不同CPU中也各不相同。目前主流的Intel系列CPU以小端序方式保存数据。2台字节序不同的计算机之间数据传递会出现问题,只有改变数据保存顺序才能被识别为同一值
所以,在通过网络传输数据时约定统一方式,这种约定称为网络字节序(Network Byte Order),统一为大端序。即,先把数据数组转化成大端序格式再进行网络传输
字节序转换(Endian Conversion)
转换字节序的函数:
-
unsigned short htons(unsigned short);
-
unsigned short ntohs(unsigned short);
-
unsigned long htonl(unsigned long);
-
unsigned long ntohl(unsigned long);
其中,
- htons中的h代表主机(host)字节序
- htons中的n代表网络(network)字节序
- s指short;l指的是long(Linux中long类型占用4个字节)
- 通常htons和ntohs用于端口号转换;htonl和ntohl用于IP地址转换
- 即使在大端序系统中,最好也经过主机字节序转换为网络字节序的过程,便于代码扩展
- 除了向sockaddr_in结构体变量填充数据外,其他情况无需考虑字节序问题,都是自动的
网络地址的初始化与分配
将字符串信息转换为网络字节序的整数型
sockaddr_in中保存地址信息的成员为32位整数型,但对于IP地址的表示,我们熟悉的是点分十进制表示法(Dotted Decimal Notation),而非整数型数据表示法
(1)inet_addr()
使用inet_addr函数可以将字符串形式的IP地址转换成32位整数型数据
#include <arpa/inet.h>
in_addr_t inet_addr(const char* string);
成功时返回32位大端序整数型值,失败时返回INADDR_NONE
(2)inet_aton()
inet_aton函数与inet_addr函数在功能上完全相同,也将字符串形式IP地址转换为32位网络字节序整数并返回。只不过该函数利用了in_addr结构体,且使用频率更高
#include <arpa/inet.h>
int inet_aton(const char* string, struct in_addr * addr);
成功时返回1,失败时返回0。string:含有需转换的IP地址信息的字符串地址值;addr:将保存转换结果的in_addr结构体变量的地址值
(3)inet_ntoa()
与inet_aton函数正好相反,inet_ntoa可以把网络字节序整数型IP地址转换成我们熟悉的字符串形式
#include <arpa/inet.h>
char* inet_ntoa(struct in_addr adr);
成功时返回转换的字符串地址值,失败时返回-1
该函数未向程序员要求分配内存,而是在内部申请了内存并保存了字符串。也就是说,调用完该函数后,应立即将字符串信息复制到其他内存空间;否则,再次调用该函数,会覆盖之前保存的字符串信息
网络地址初始化
常见的网络地址信息初始化方法如下:
struct sockaddr_in addr;
memset(&addr, 0, sizeof(addr)); // 结构体变量addr的所有成员初始化为0
addr.sin_family = AF_INET; // 指定地址族
addr.sin_addr.s_addr = inet_addr(serv_ip); // 基于字符串的IP地址初始化
addr.sin_port = htons(atoi(serv_port)); // 基于字符串的端口号初始化
让所有成员初始化为0,是为了将sin_zero初始化为0
客户端地址信息初始化
服务器端声明sockaddr_in结构体变量,将其初始化为赋予服务器端IP和套接字的端口号,然后调用bind函数;而客户端则声明sockaddr_in结构体,并初始化为要与之连接的服务器端套接字的IP和端口号,然后调用connect函数
INADDR_ANY
利用常数INADDR_ANY分配服务器端的IP地址:
addr.sin_addr.s_addr = htonl(INADDR_ANY);
若采用这种方式,则可自动获取运行服务器端的计算机IP地址。而且,若同一计算机中已分配多个IP地址(多宿主(Multi-homed)计算机,路由器属于这一类),则只要端口号一致,就可以从不同IP地址接收数据。因此,服务器端中优先考虑这种方式;而客户端中除非带有一部分服务器端功能,否则不会采用
同一计算机中可以分配多个IP地址,实际IP地址的个数与计算机中安装的NIC的数量相等。即使是服务器端套接字,也需要决定应接收哪个IP传来的(哪个NIC传来的)数据。因此,服务器端套接字初始化过程中要求IP地址信息。若只有1个NIC,则直接使用INADDR_ANY
向套接字分配网络地址
bind函数负责把初始化的地址信息分配给套接字
#include <sys/socket.h>
int bind(int sockfd, struct sockaddr* myaddr, socklen_t addrlen);
成功时返回0,失败时返回-1。sockfd:要分配地址信息(IP地址和端口号)的套接字文件描述符;myaddr:存有地址信息的结构体变量地址值;addrlen:第二个结构体变量的长度
基于Windows的实现
htons和htonl
与Linux平台下的使用无区别
inet_addr和inet_ntoa
Windows中不存在inet_aton,而inet_addr和inet_ntoa的使用于Linux下一样。但inet_addr会出现不能使用的情况,可以用inet_pton,需要包含头文件<Ws2tcpip.h>
#include <stdio.h>
#include <string.h>
#include <WinSock2.h>
#include <Ws2tcpip.h>
void ErrorHandling(char* message);
int main(int argc, char* argv[])
{
WSADATA wsaData;
if (WSAStartup(MAKEWORD(2, 2), &wsaData) != 0)
{
ErrorHandling("WSAStartup() error!");
}
{
char* addr = "127.212.124.78";
// unsigned long conv_addr = inet_addr(addr);
// if (conv_addr == INADDR_NONE)
// {
// printf("Error occured! \n");
// }
// else
// {
// printf("Network ordered integer addr: %#lx \n", conv_addr);
// }
unsigned long conv_addr;
if ((inet_pton(AF_INET, addr, &conv_addr)) == 0)
{
printf("Error occured! \n");
}
else
{
printf("Network ordered integer addr: %#lx \n", conv_addr);
}
}
{
struct sockaddr_in addr;
char* strPtr;
char strArr[20];
addr.sin_addr.s_addr = htonl(0x1020304);
strPtr = inet_ntoa(addr.sin_addr);
strcpy(strArr, strPtr);
printf("Dotted-Decimal notation3 %s \n", strArr);
}
WSACleanup();
return 0;
}
void ErrorHandling(char* message)
{
fputs(message, stderr);
fputc('\n', stderr);
exit(1);
}
WSAStringToAddress和WSAAddressToString
这是WinSock2中增加的2个转换函数,在功能上与inet_addr和inet_ntoa完全相同,但优点在于支持多种协议,在IPv4和IPv6中均可适用。但这两个函数依赖于特定平台,会降低兼容性
(1)WSAStringToAddress
#include <WinSock2.h>
INT WSAStringToAddress(
LPTSTR AddressString, INT AddressFamily, LPWSAPROTOCOL_INFO lpProtocolInfo,
LPSOCKADDR lpAddress, LPINT lpAddressLength
);
成功时返回0,失败时返回SOCKET_ERROR。AddressString:含有IP和端口号的字符串地址值;AddressFamily:第一个参数中地址所属的地址族信息;lpProtocolInfo:设置协议提供这(Provider),默认为NULL;lpAddress:保存地址信息的结构体变量地址值;lpAddressLength:第四个参数中传递的结构体长度所在的变量地址值。新出现的各种类型都是针对默认数据类型的typedef声明
(2)WSAAddressToString
它将结构体中的地址信息转换成字符串形式
#include <WinSock2.h>
INT WSAAddressToString(
LPSOCKADDR lpsaAddress, DWORD dwAddressLength,
LPWSAPROTOCOL_INFO lpProtocolInfo, LPSTR lpszAddressString,
LPDWORD lpdwAddressStringLength
);
成功时返回0,失败时返回SOCKET_ERROR。lpsaAddress:需要转换的地址信息结构体变量地址值;dwAddressLength:第一个参数中结构体的长度;lpProtocolInfo:设置协议提供者(Provider),默认为NULL;lpszAddressString:保存转换结果的字符串的地址值;lpdwAddressStringLength:第四个参数中存有地址信息的字符串长度
示例:
#undef UNICODE
#undef _UNICODE
#include <stdio.h>
#include <WinSock2.h>
int main(int argc, char* argv[])
{
char* strAddr = "203.211.218.102:9190";
char strAddrBuf[50];
SOCKADDR_IN servAddr;
int size;
WSADATA wsaData;
WSAStartup(MAKEWORD(2, 2), &wsaData);
size = sizeof(servAddr);
WSAStringToAddress(
strAddr, AF_INET, NULL, (SOCKADDR*)&servAddr, &size);
size = sizeof(strAddrBuf);
WSAAddressToString(
(SOCKADDR*)&servAddr, sizeof(servAddr), NULL, strAddrBuf, &size);
printf("Second conv result: %s \n", strAddrBuf);
WSACleanup();
return 0;
}