本系列文章为《TCP/IP网络编程----尹圣雨》学习笔记,前面的系列文章链接如下
TCP/IP网络编程:P1->理解网络编程和套接字
TCP/IP网络编程:P2->套接字类型与协议设置
前言
前面一章讨论了套接字的创建方法,如果把套接字比喻为电话,那么目前只安装了电话机。本章着重讲解给电话机分配号码的方法,即给套接字分配IP地址和端口号。
一、分配给套接字的IP地址与端口号
IP是Internet Protocol(网络协议)的简写,是为收发网络数据而分配给计算机的值。端口号并非赋予计算机的值,而是为区分程序中创建的套接字而分配给套接字的序号。
1.1 网络地址(Internet Address)
IP地址
为使计算机连接到网络并收发数据,必须为其分配IP地址。IP地址分为两类。
①IPV4(Internet Protocol version 4)4 字节地址族
②IPV6(Internet Protocol version 6)6 字节地址族
区别: 两者之间的主要差别是IP地址所用的字节数,目前IPV4和IPV6都已经通用。
IPv4
IPV4标准的4字节IP地址分为网络地址和主机(指计算机)地址,且分为 A、B、C、D、E 等类型。下图展示了IPv4地址族,一般不会使用已被预约了的E类地址,故省略。
数据传输过程: 网络地址(网络ID)是为区分网络而设置的一部分IP地址。假设向WWW.SEMI.COM公司传输数据,该公司内部构建了局域网,把所有计算机连接起来。因此,首先应向SEMI.COM网络传输数据,也就是说,并非一开始就浏览所有4字节IP地址进而找到目标主机。而是仅浏览4字节IP地址的网络地址,先把数据传到SEMI.COM的网络。SEMI.COM网络(构成网络的路由器)接收到数据后,浏览传输数据的主机地址(主机ID),并将数据传给目标计算机。
示例: 某主机向203.211.172.103和203.211.217.202传输数据,其中203.211.172和203.211.217为该网络的网络地址。所以,向相应网络传输数据实际上是向构成网络的路由器(Router)或交换机(Switch)传递数据,由接收数据的路由器根据数据中的主机地址向目标主机传递数据。
路由器与交换机
若想构建网络,需要一种物理设备完成外网与本网主机之间的数据交换,这种设备便是路由器或交换机。它们实际上也是一种计算机,只不过是为特殊目的而设计运行的,因此有了别名。所以,如果在我们使用的计算机上安装适当的软件,也可以将其用作交换机。另外,交换机比路由器功能要简单一些,而实际用途差别不大。
1.2 网络地址分类与主机地址边界
只需通过IP地址的第一个字节即可判断网络地址占用的字节数,因为我们根据IP地址的边界区分网络地址,如下所示:
- A类地址的首字节范围:0~127
- B类地址的首字节范围:128~191
- C类地址的首字节范围:192~223
还有如下这种表述方式:
- A类地址的首位以0开始
- B类地址的前2位以10开始
- C类地址的前3位以110开始
正因如此,通过套接字收发数据时,数据传到网络后即可轻松找到正确的主机。
1.3 用于区分套接字的端口号
端口号的产生背景
IP用于区分计算机,只要有IP地址就能向目标主机传输数据,但仅凭这些无法传输给最终的应用程序。假设各位欣赏视频的同时在网上冲浪,这时至少需要1个接收视频数据的套接字和1个接收网页信息的套接字。问题在于如何区分二者。简言之,传输到计算机的网络数据是发给播放器还是发送给浏览器?
端口号的使用示例
背景: 假设我开发了收发数据的P2P程序,该程序用块单位分割1个文件,从多台计算机接收数据。
问题: 如上所述,若想接收多台计算机发来的数据,则需要相应个数的套接字。那如何区分这些套接字呢?
答案: 计算机中一般配有NIC(Network Interface Card,网络接口卡)数据传输设备。通过NIC向计算机内部传输数据时会用到IP。操作系统负责把传递到内部的数据适当分配给套接字,这时就要利用端口号。也就是说,通过NIC接收的数据内有端口号,操作系统正是参考此端口号把数据传输给相应端口的套接字,如下图所示。
端口号的性质
①端口号就是在同一操作系统内为区分不同套接字而设置的,因此无法将1个端口号分配给不同套接字。
②另外,端口号由16位构成,可分配的端口号范围是0-65535。但0-1023是知名端口(Well-known PORT),一般分配给特定应用程序,所以应当分配此范围之外的值。
③最后,虽然端口号不能重复,但TCP套接字和UDP套接字不会共用端口号,所以允许重复。例如:如果某TCP套接字使用9190号端口,则其他TCP套接字就无法使用该端口号,但UDP套接字可以使用。
总结: 总之,数据传输目标地址同时包含IP地址和端口号,只有这样数据才会被传输到最终的目的应用程序(应用程序套接字)。
二、地址信息的表示
应用程序中使用的IP地址和端口号以结构体的形式给出了定义。本节以IPv4为中心,围绕此结构体讨论目标地址的表示方法。
2.1 表示IPv4地址的结构体
填写地址信息时围绕提问为线索进行:
-
提问1:“采用哪一种地址族?”
回答1:“基于IPv4的地址族。”
-
提问2:“IP地址是多少?”
回答2:“211.204.214.76。”
-
提问3:“端口号是多少?”
回答3:“2048。”
结构体定义为如下形态就能包含上述信息,此结构体将作为地址信息传递给bind函数。
struct sockaddr_in
{
sa_family_t sin_family; //地址族(Address Family)
uint16_t sin_port; //16 位 TCP/UDP 端口号
struct in_addr sin_addr; //32位 IP 地址
char sin_zero[8]; //不使用
};
该结构体中提到的另一个结构体in_addr定义如下,它用来存放32位IP地址。
struct in_addr
{
in_addr_t s_addr; //32位IPV4地址
}
讲解以上2个结构体前先观察一些数据类型。uint16_t
、in_addr_t
等类型可以参考POSIX(Portable Operating System Interface,可移植操作系统接口)。POSIX是为UNIX系列操作系统设立的标准,它定义了一些其他数据类型,如下表所示。
数据类型名称 | 数据类型说明 | 声明的头文件 |
---|---|---|
int 8_t | signed 8-bit int | sys/types.h |
uint8_t | unsigned 8-bit int (unsigned char) | sys/types.h |
int16_t | signed 16-bit int | sys/types.h |
uint16_t | unsigned 16-bit int (unsigned short) | sys/types.h |
int32_t | signed 32-bit int | sys/types.h |
uint32_t | unsigned 32-bit int (unsigned long) | sys/types.h |
sa_family_t | 地址族(address family) | sys/socket.h |
socklen_t | 长度(length of struct) | sys/socket.h |
in_addr_t | IP地址,声明为 uint_32_t | netinet/in.h |
in_port_t | 端口号,声明为 uint_16_t | netinet/in.h |
从这些数据类型声明也可掌握之前结构体的含义。额外定义这些数据类型的原因是:这是考虑到扩展性的结果。如果使用int32_t类型的数据,就能保证在任何时候都占用4字节,即使将来用64位表示int类型也是如此。
2.2 结构体sockaddr_in的成员分析
①成员 sin_family
每种协议适用的地址族不同。比如,IPV4使用4字节的地址族,IPV6使用16字节的地址族。
sin_family地址信息如下表所示:
地址族(Address Family) | 含义 |
---|---|
AF_INET | IPV4网络协议中用的地址族 |
AF_INET6 | IPV6网络协议中用的地址族 |
AF_LOCAL | 本地通信中采用的UNIX协议的地址族 |
注: AF_LOACL
只是为了说明具有多种地址族而添加的。
②成员 sin_port
该成员保存16位端口号,重点在于它以网络字节序保存。
③成员 sin_addr
该成员保存32位IP地址信息,且也以网络字节序保存。为理解好该成员,应同时观察结构体in_addr。但结构体in_addr声明为uint32_t,因此只需当作32位整数型即可。
④成员 sin_zero
无特殊含义。只是为结构体
sockaddr_in
的大小与sockaddr
结构体保持一致而插入的成员。必须填充为0,否则无法得到想要的结果。
sockaddr_in 结构体的使用
在之前的代码中,sockaddr_in
结构体变量地址值将以如下方式传递给bind函数。
struct sockaddr_in serv_addr;
....
if (bind(serv_sock, (struct sockaddr *)&serv_addr, sizeof(serv_addr)) == -1)
error_handling("bind() error");
....
此处bind第二个参数期望得到sockaddr结构体变量的地址值,包括地址族、端口号、IP地址等。sockaddr结构体的定义如下:
struct sockaddr
{
sa_family_t sin_family; //地址族
char sa_data[14]; //地址信息
}
注意:
①sockaddr是通用的结构体,并非只为IPv4设计,这从保存地址信息的数组sa_data长度为14字节也可看出。因此,结构体sockaddr要求在sin_family中指定地址族信息。
②对于包含地址信息来讲使用sockaddr非常麻烦,所以我们使用新的结构体sockaddr_in生成符合bind函数要求的字节流。最后将sockaddr_in型的结构体强制转换为sockaddr型的结构体变量,再传递给bind函数即可。
③由于结构体sockaddr并非只为IPv4设计,为了与sockaddr保持一致,所以sockaddr_in结构体中也有地址族信息。
三、网络字节序与地址变换
背景
不同CPU中,4字节整数型值1在内存空间的保存方式是不同的。4字节整数型值1可用2进制表示如下。
00000000 00000000 00000000 00000001
有些CPU以这种顺序保存到内存,另外一些CPU则以倒序保存.
00000001
00000000 00000000 00000000
若不考虑这些就收发数据则会发生问题,因为保存顺序的不同意味着对接收数据的解析顺序也不同。
3.1 字节序(Order)与网络字节序
字节序
CPU向内存保存数据的方式有2种,这意味着CPU解析数据的方式也分为2种。
①大端序(Big Endian):高位字节存放到低位地址。
②小端序(Little Endian):高位字节存放到高位地址。
示例: 不同字节序保存数据的方式
假设在0x20号开始的地址中保存4字节int类型数0x12345678。
①大端序CPU保存方式:
整数0x12345678中,0x12是最高位字节,0x78是最低位字节。因此,大端序中先保存最高位字节0x12(最高位字节0x12存放到低位地址)。
②小端序CPU保存方式:
先保存最低位字节0x78
总结: 从以上分析可以看出,每种CPU的数据保存方式均不同。因此,代表CPU数据保存方式的 主机字节序(Host Byte Order) 在不同CPU中也各不相同。目前主流的Intel系列CPU以小端序方式保存数据。
示例: 字节序问题
接下来分析2台字节序不同的计算机之间数据传递过程中可能出现的问题,如下图所示。
问题: 上图中,大端序系统传输数据0x1234时未考虑字节序问题,直接以0x12、0x34的顺序发送。接收端以小端序方式保存数据,因此小端序接收的数据变成0x3412。
解决方案: 在通过网络传输数据时,将数据组的格式统一约定为大端序,这种约定称为网络字节序(Network Byte Order)。因此,所有计算机接收数据时应识别该数据是网络字节序格式,小端序系统传输数据时应转化为大端序排列方式。
3.2 字节序转换(Endian Conversions)
字节序转换函数
下面介绍帮助转换字节序的函数。
①unsigned short htons(unsigned short);
②unsigned short ntohs(unsigned short);
③unsigned long htonl(unsigned long);
④unsined long ntohl(unsigned long);
函数名的含义
①htons中的h
代表主机(host)字节序。
②htons中的n
代表网络(network)字节序。
③htons中的s
指的是short。
④htons中的l
指的是long(Linux中long类型占用4个字节,这很关键)。
因此,htons是h、to、n、s的组合,也可以解释为把short型数据从主机字节序转化为网络字节序。ntohs可以解释为把short型数据从网络字节序转化为主机字节序。
端口号转换与IP地址转换
通常,以s
作为后缀的函数中,s
代表2个字节short,因此用于端口号转换。
以l
作为后缀的函数中,l
代表4个字节,因此用于IP地址转换。
疑问: 我的系统是大端序的,为sockaddr_in结构体变量赋值前就不需要转换字节序了吧?
回答: 这么说也不能算错。但我认为,有必要编写与大端序无关的统一代码。这样,即使在大端序系统中,最好也经过主机字节序转换为网络字节序的过程。当然,此时主机字节序与网络字节序相同,不会有任何变化。
示例: 字节序转换函数使用案例(Linux)
#include <stdio.h>
#include <arpa/inet.h>
int main(int argc, char *argv[])
{
unsigned short host_port = 0x1234;
unsigned short net_port;
unsigned long host_addr = 0x12345678;
unsigned long net_addr;
net_port = htons(host_port);
net_addr = htonl(host_addr);
printf("Host ordered port: %#x \n", host_port);
printf("Network ordered port: %#x \n", net_port);
printf("Host ordered address: %#lx \n", host_addr);
printf("Network ordered address: %#lx \n", net_addr);
return 0;
}
下面这就是在小端序CPU中运行的结果。如果在大端序CPU中运行,则变量值不会改变。大部分朋友都会得到类似的运行结果,因为Intel和AMD系列的CPU都采用小端序标准。
思考
问题: 数据在传输之前都要经过转换吗?
答: 也许有人认为:“既然数据传输采用网络字节序,那在传输前应直接把数据转换成网络字节序,接收的数据也需要转换成主机字节序再保存。”实际上,这个过程是自动的。除了向sockaddr_in结构体变量填充数据外,其他情况无需考虑字节序问题。
四、网络地址的初始化和分配
前面已讨论过网络字节序,接下来介绍以bind函数为代表的结构体的应用。
4.1 将字符串信息转换为网络字节序的整数型
sockaddr_in中保存地址信息的成员为32位整数型。然而,对于IP地址的表示,我们熟悉的是点分十进制表示法(Dotted Decimal Notation),而非整数型数据表示法。幸运的是,有函数会帮我们将字符串形式的IP地址转换成32位整数型数据,在转换类型的同时进行网络字节序转换。
4.1.1 inet_addr函数
inet_addr函数的声明如下:
#include<arpa/inet.h>
in_addr_t inet_addr(const char * string);
//成功时返回32位大端序整数型值,失败时返回INADDR_NONE。
如果向该函数传递类似211.214.107.99
的点分十进制格式的字符串,它会将其转换为32位整数型数据并返回。当然,该整数型值满足网络字节序。另外,该函数的返回值类型in_addr_t在内部声明为32位整数型。
示例: inet_addr函数的调用过程
#include <stdio.h>
#include <arpa/inet.h>
int main(int argc, char *argv[])
{
char *addr1 = "1.2.3.4";
//1个字节能表示的最大整数是255,所以代码中 addr2 是错误的IP地址。从运行结果看,inet_addr 不仅可以转换地址,还可以检测有效性。
char *addr2 = "1.2.3.256";
unsigned long conv_addr = inet_addr(addr1);
if (conv_addr == INADDR_NONE) //正确
printf("Error occured! \n");
else
printf("Network ordered integer addr: %#lx \n", conv_addr);
conv_addr = inet_addr(addr2);
if (conv_addr == INADDR_NONE) //错误
printf("Error occured! \n");
else
printf("Network ordered integer addr: %#lx \n", conv_addr);
return 0;
}
运行,可以看出inet_addr函数不仅可以把IP地址转成32位整数型,而且可以检测无效的IP地址。另外,从输出结果可以验证确实转换为网络字节序。
4.1.2 inet_aton函数
inet_aton函数与inet_addr函数在功能上完全相同,也将字符串形式IP地址转换为32位网络字节序整数并返回。不同的是该函数利用了in_addr结构体,且使用频率更高。
#include<arpa/inet.h>
int inet_aton(const char * string, struct in_addr * addr);
/*
成功时返回1(true),失败时返回0(false)。
参数1:string,含有需转换的IP地址信息的字符串地址值。
参数2:addr,将保存转换结果的in_addr结构体变量的地址值。
*/
调用inet_addr函数,返回转换后的IP地址信息还需保存到sockaddr_in结构体中声明的in_addr结构体变量。而inet_aton函数则不需此过程,因为该函数会自动把结果存入该结构体变量。
示例: inet_aton函数的调用过程
#include<stdio.h>
#include<stdlib.h>
#include<arpa/inet.h>
void error_handling(char * message);
int main(int argc, char *argv[])
{
char * addr = "127.232.124.79";
struct sockaddr_in addr_inet;
if(!inet_aton(addr, &addr_inet.sin_addr))//转换后的IP地址信息虚构保存到sockaddr_in的in_addr型变量才有意义。因此inet_aton函数的第二个参数要求得到in_addr型的变量地址值。这就省去了手动保存IP地址信息的过程。
error_handling("Conversion error");
else
printf("Network order integer addr: %#x \n",
addr_inet.sin_addr.s_addr);
return 0;
}
void error_handling(char * message)
{
fputs(message, stderr);
fputc('\n', stderr);
exit(1);
}
运行,结果如下。可以看出,已经成功的把转换后的地址放进了addr_inet.sin_addr.s_addr
中。
4.1.3 inet_ntoa函数
还有一个函数,与 inet_aton() 正好相反,它可以把网络字节序整数型IP地址转换成我们熟悉的字符串形式,函数原型如下:
#include <arpa/inet.h>
char *inet_ntoa(struct in_addr adr);
注意:
----该函数将通过参数传入的整数型IP地址转换为字符串格式并返回。
----但要小心,返回值为 char 指针,返回字符串地址意味着字符串已经保存在内存空间,但是该函数未向程序员要求分配内存,而是在内部申请了内存保存了字符串。也就是说调用了该函数候要立即把信息复制到其他内存空间。因为,若再次调用inet_ntoa函数,则有可能覆盖之前保存的字符串信息。
----总之,再次调用 inet_ntoa 函数前返回的字符串地址是有效的。若需要长期保存,则应该将字符串复制到其他内存空间。
示例: inet_ntoa函数的调用过程
#include<stdio.h>
#include<string.h>
#include<arpa/inet.h>
int main(int argc, char * argv[])
{
struct sockaddr_in addr1, addr2;
char *str_ptr;
char str_arr[20];
addr1.sin_addr.s_addr = htonl(0x1020304);
addr2.sin_addr.s_addr = htonl(0x1010101);
//把结构体变量addr1中的IP地址信息转换为字符串形式
str_ptr = inet_ntoa(addr1.sin_addr);
strcpy(str_arr, str_ptr); //浏览并复制上面返回的IP地址信息
printf("Dotted-Decimal notation1: %s \n", str_ptr);
/*
再次调用inet_ntoa函数。由此得出,第调用inet_ntoa那一行中返回的地址已覆盖了新的IP地址字符串,可通过第打印str_ptr的输出结果进行验证。
*/
inet_ntoa(addr2.sin_addr);
printf("Dotted-Decimal notation2: %s \n", str_ptr);
//因为inet_ntoa返回的IP地址笛福传保存到了str_arr中,因此可以正确输出
printf("Dotted-Decimal notation3: %s \n", str_arr);
return 0;
}
运行,结果如下。可以看出成功将IP地址转化为字符串。
4.2 网络地址初始化
下面是服务器端套接字创建过程中常见的网络地址信息初始化方法:
struct sockaddr_in addr;
char *serv_ip = "211.217.168.13"; // 声明 IP 地址字符串
char *serv_port = "9190"; // 声明端口号字符串
memset(&addr, 0, sizeof(addr)); // 结构体变量 addr 的所有成员初始化为 0,主要是为了将 sockaddr_in 的成员 sin_zero 初始化为 0。
addr.sin_family = AF_INET; // 指定地址族
addr.sin_addr.s_addr = inet_addr(serv_ip); // 基于字符串的 IP 地址初始化
addr.sin_port = htons(atoi(serv_port)); // 基于字符串的端口号初始化
代码解读
①上述代码中,memset函数将每个字节初始化为同一值:
----第一个参数为结构体变量addr的地址值,即初始化对象为addr
----第二个参数为0,因此初始化值为0
----第三个参数传入addr的长度
因此addr的所有字节均初始化为0。这么做是为了将sockaddr_in结构体的成员sin_zero初始化为0。
②最后一行代码调用的atoi函数把字符串类型的值转换成整数型。
③总之,上述代码利用字符串格式的IP地址和端口号初始化了sockaddr_in结构体变量。
④另外,代码中对IP地址和端口号进行了硬编码,这并非良策,因为运行环境改变就得更改代码。因此,我们运行时传入IP地址和端口号会更好。
4.3 客户端地址信息初始化
上述网络地址信息初始化过程主要针对服务器端而非客户端。给套接字分配IP地址和端口号主要是为下面这件事做准备:
“请把进入IP 211.217.168.13、9190端口的数据传给我!”
反观客户端中连接请求如下:
“请连接到IP 211.217.168.13、9190端口!”
请求方法不同意味着调用的函数也不同:
- 服务器端的准备工作通过bind函数完成
- 客户端的准备工作通过connect函数完成
因此函数调用前需准备的地址值类型也不同:
- 服务器端声明sockaddr_in结构体变量,将其初始化为赋予服务器端IP和套接字的端口号,然后调用bind函数
- 客户端声明sockaddr_in结构体,并初始化为要与之连接的服务器端套接字的IP和端口号,然后调用connect函数。
4.4 INADDR_ANY
每次创建服务器端套接字都要输入IP地址会有些繁琐,此时可如下初始化地址信息:
struct sockaddr_in addr;
char * serv_port = "9190";
memset(&addr, 0, sizeof(addr));
addr.sin_family = AF_INET;
add.sin_addr.s_addr = htonl(INADDR_ANY);
addr.sin_port = htons(atoi(serv_port));
与之前方式的区别
与之前方式最大的区别在于,利用常数INADDR_ANY分配服务器端的IP地址。
----若采用这种方式,则可自动获取运行服务器端的计算机IP地址,不必亲自输入。
----而且,若同一计算机中已分配多个IP地址(多宿主(Multi-homed)计算机,一般路由器属于这一类),则只要端口号一致,就可以从不同IP地址接收数据。
因此,服务器端中优先考虑这种方式。而客户端中除非带有一部分服务器端功能,否则不会采用。
创建服务器端套接字时需要IP地址的原因
问题: 初始化服务器端套接字时应分配所属计算机的IP地址,因为初始化时使用的IP地址非常明确,那为何还要进行IP初始化呢?
答案: 同一计算机中可以分配多个IP地址,实际IP地址的个数与计算机中安装的NIC的数量相等。即使是服务器端套接字,也需要决定应接收哪个IP地址传来的(哪个NIC传来的)数据。因此,服务器端套接字初始化过程中要求IP地址信息。另外,若只有一个NIC,则直接使用INADDR_ANY。
4.5 第1章的hello_server.c、hello_client.c运行过程
-
第1章中执行
./hserver 9190
命令以运行相当于服务器端的hello_server.c。通过代码可知,向main函数传递的9190为端口号。通过此端口创建服务器端套接字并运行程序,但未传递IP地址,因为可以通过INADDR_ANY指定IP地址。 -
执行
./hclient 127.0.0.1
命令以运行相当于客户端的hello_client.c。与服务器端运行方式相比,最大的区别是传递了IP地址信息。 -
127.0.0.1是回送地址(loopback address),指的是计算机自身IP地址。在第1章的示例中,服务器端和客户端在同一计算机中运行。因此,连接目标服务器端的地址为127.0.0.1。当然,若用实际IP地址代替此地址也能正常运转。如果服务器端和客户端分别在2台计算机中运行,则可以输入服务器端IP地址。
4.6 向套接字分配网络地址
前面了解了sockaddr_in结构体的初始化方法,接下来就把初始化的地址信息分配给套接字。bind函数负责这项操作。
#include<sys/socket.h>
int bind(int sockfd, struct sockaddr * myaddr, socklen_t addrlen);
/*
成功时返回0,失败时返回-1。
参数1:sockfd,要分配地址信息(IP地址和端口号)的套接字文件描述符
参数2:myaddr,存有地址信息的结构体变量地址值。
参数3:addrlen,第二个结构体变量的长度。
*/
如果此函数调用成功,则将第二个参数指定的地址信息分配给第一个参数中的相应套接字。
示例: 服务器端常见套接字初始化过程
int serv_sock;
struct sockaddr_in serv_addr;
char * srev_port = "9190";
/* 创建服务器端套接字(监听套接字)*/
serv_sock = socket(PF_INET, SOCK_STREAM, 0);
/* 地址信息初始化 */
memset(&serv_addr, 0, sizeof(serv_addr));
serv_addr.sin_family = AF_INET;
serv_addr.sin_addr.s_addr = htonl(INADDR_ANY);
serv_addr.sin_port = htons(atoi(serv_port));
/* 分配地址信息 */
bind(serv_sock, (struct sockaddr * )&serv_addr, sizeof(serv_addr));
服务器端代码结构默认如上,当然还有未显示的异常处理代码。
五、基于Windows的实现
Windows中同样存在sockaddr_in
结构体及各种变换函数,而且名称、使用方法及含义都相同。也就无需针对Windows平台进行太多修改或改用其他函数。接下来将前面几个程序改成Windows版本。
5.1 函数htons、htonl在Windows中的使用
示例: Windows平台下调用htons函数和htonl函数,这两个函数的用法与Linux平台下的使用并无区别。
#include <WinSock2.h>
#include <stdio.h>
int main(int argc, char *argv[])
{
WSADATA wsa_data;
unsigned short host_port = 0x1234;
unsigned short net_port;
unsigned long host_addr = 0x12345678;
unsigned long net_addr;
if (WSAStartup(MAKEWORD(2, 2), &wsa_data) != 0)
printf("WSAStarup() error!");
net_port = htons(host_port);
net_addr = htonl(host_addr);
printf("Host ordered port: %#x \n", host_port); // 打印结果:0x1234
printf("Network ordered port: %#x \n", net_port); // 打印结果:0x3412
printf("Host ordered address: %#x \n", host_addr); // 打印结果:0x12345678
printf("Network ordered address: %#x \n", net_addr); // 打印结果:0x78563412
WSACleanup();
return 0;
}
该程序多了进行库初始化的WSAStartup函数调用和winsock2.h头文件的#include语句,其他部分没有区别。运行,结果如下:
5.2 函数inet_addr、inet_ntoa在Windows中的使用
前面分别给出了Linux中这两个函数的调用示例,而Windows中不存在inet_aton函数,故这里省略inet_aton函数的调用。
示例: inet_addr函数和inet_ntoa函数的调用过程
#pragma execution_character_set("utf-8")
#include <stdio.h>
#include <string.h>
#include <WinSock2.h>
void ErrorHandling(char* message);
int main(int argc, char* argv[])
{
WSADATA wsaData;
if (WSAStartup(MAKEWORD(2, 2), &wsaData) != 0)
printf("WSAStarup() error!");
// inet_addr 函数调用示例
{
char* addr = "127.212.124.78";
unsigned long conv_addr = inet_addr(addr);
if(conv_addr == INADDR_NONE)
printf("Error occured!\n");
else
printf("Network ordered integer addr: %#lx \n", conv_addr);
}
// inet_ntoa 函数调用示例
{
struct sockaddr_in addr;
char* strPtr;
char strArr[20];
addr.sin_addr.s_addr = htonl(0x1020304);
strPtr = inet_ntoa(addr.sin_addr);
strcpy(strArr, strPtr);
printf("Dotted-Decimal notation3 %s \n", strArr);
}
WSACleanup();
return 0;
}
void ErrorHandling(char* message)
{
fputs(message, stderr);
fputc('\n', stderr);
exit(1);
}
运行,结果如下
5.3 在Wondows环境下向套接字分配网络地址
Windows中向套接字分配网络地址的过程与Linux中完全相同,因为bind函数的含义、参数及返回类型完全一致。
sOCKET servSock;
struct sockaddr_in servAddr;
char * servPort = "9190";
/*创建服务器端套接字*/
servSock = socket(PF_INET,SOCK_STREAM,0);
/*地址信息初始化*/
memset(&servAddr, 0, sizeof( servAddr));
servAddr.sin_family = AF_INET;
servAddr.sin_addr.s_addr = hton1( INADDR_ANY);
servAddr.sin_port = htons(atoi(serv_port));
/*分配地址信息*/
bind(servSock,(struct sockaddr * )&servAddr,sizeof( servAddr));
这与Linux平台下套接字初始化及地址分配过程基本一致,只不过改了一些变量名。
5.4 WSAStringToAddress & WSAAddressToString
这两个转换函数的优缺点
下面介绍Winsock2中增加的2个转换函数,它们在功能上与inet_ntoa和inet _addr完全相同。
①优点: 支持多种协议,在IPv4和IPv6中均可适用。
②缺点: 使用inet _ntoa、inet _addr可以很容易地在Linux和Windows之间切换程序。而将要介绍的这2个函数则依赖于特定平台,会降低兼容性。因此本书不会使用它们,介绍的目的仅在于让各位了解更多函数。
5.4.1 WSAStringToAddress
WSAStringToAddress函数将地址信息字符串适当填入结构体变量。
#include <winsock2.h>
INT WSAStringToAddress(
LPTSTR AddressString, INT AddressFamily, LPwSAPROTOCOL_INFO lpProtocolInfo,
LPSOCKADDR lpAddress, LPINT lpAddressLength
);
//成功时返回0,失败时返回SOCKET_ERROR。
/*
AddressString 含有IP和端口号的字符串地址值。
AddressFamily 第一个参数中地址所属的地址族信息。
lpProtocollnfo 设置协议提供者(Provider),默认为NULL。
lpAddress 保存地址信息的结构体变量地址值。
lpAddressLength 第四个参数中传递的结构体长度所在的变量地址值。
*/
上述函数中新出现的各种类型几乎都是针对默认数据类型的typedef声明。后面的示例主要通过默认数据类型向该函数传递参数。
5.4.2 WSAAddressToString
WSAAddressToString与WSAStringToAddress在功能上正好相反,它将结构体中的地址信息转换成字符串形式。
#include <winsock2.h>
INT wSAAddressToString(
LPSOCKADDR lpsaAddress, DWORD dwAddressLength,
LPWSAPROTOCOL_INFO lpProtocolInfo, LPSTR lpszAddressString,
LPDWORD lpdwAddressstringLength
);
//成功时返回0,失败时返回SOCKET__ERROR。
/*
lpsaAddress 需要转换的地址信息结构体变量地址值。
dwAddressLength 第一个参数中结构体的长度。
lpProtocollnfo 设置协议提供者(Provider),默认为NULL。
lpszAddressString 保存转换结果的字符串地址值。
lpdwAddressStringLength 第四个参数中存有地址信息的字符串长度。
*/
5.4.3 函数示例
示例: WSAAddressToString与WSAStringToAddress函数的使用
#pragma execution_character_set("utf-8")
/*
#undef用于取消之前定义的宏。根据项目环境,VC++会自主声明这2个宏,
这样在第18行和第22行调用的函数中,参数就将转换成unicode形式,给出错误的运行结果。所以插入了这2句宏定义。
*/
#undef UNICODE
#undef _UNICODE
#include <stdio.h>
#include <winsock2.h>
int main(int argc, char* argv[]) {
char* strAddr = "203.211.218.102:9190";
char strAddrBuf[50];
SOCKADDR_IN servAddr;
int size;
WSADATA wsaData;
WSAStartup(MAKEWORD(2, 2), &wsaData);
size = sizeof(servAddr);
//前面给出了需转换的字符串格式的地址。这一行调用WSAStringToAddress函数转换成结构体, 保存到声明的变量servAddr中。
WSAStringToAddress(strAddr, AF_INET, NULL, (SOCKADDR*)&servAddr, &size);
size = sizeof(strAddrBuf);
//上面第二行代码的逆过程,调用WSAAddressToString函数将结构体转换成字符串。
WSAAddressToString((SOCKADDR*)&servAddr, sizeof(servAddr), NULL, strAddrBuf, &size);
printf("Second conv result: %s \n", strAddrBuf);
WSACleanup();
return 0;
}
运行,效果如下:
注: Linux环境下地址初始化过程中声明了sockaddr_in变量,而示例则声明了SOCKADDR_IN类型的变量。实际上二者完全相同,只是为简化变量定义添加了typedef声明。
typedef struct sockaddr_in SOCKADDR_IN;