IP是为收发网络数据而分配给计算机的值。端口号是为区分程序中创建的套接字而分配给套接字的序号。
IP地址和端口号
- 网络地址
为使计算机连接到网络并收发数据,必须向其分配IP地址,IP地址分为两类:
IPv4 4字节地址族
IPv6 16字节地址族
- 网络地址分类与主机地址边界
只需通过IP地址的第一个字节可判断网络地址占用的字节数,因为我们根据IP地址的边界区分网络地址:
A类地址的首字节范围:0-127
B类地址的首字节范围:128-191
C类地址的首字节范围:192-223
还有以下表述方式:
A类地址的首位以0开始
B类地址的前2位以10开始
C类地址的前3位以110开始
- 用于区分套接字的端口号
IP用于区分计算机,只要有IP地址就能向目标主机传输数据,但仅凭这些无法传输给最终的应用程序。如网上看视频的同时网上聊天,这时至少需要1个接收视频数据的套接字和一个接收聊天信息的套接字。如何区分这些套接字呢?
计算机中一般有网络接口卡数据传输设备,通过NIC向计算机内部传输数据时会用到IP。操作系统负责把传递到内部的数据适当分配给套接字,这时就要利用端口号。通过NIC接收的数据内有端口号,操作系统正是参考此端口号把数据传输给相应端口的套接字。
端口号就是在同一操作系统内为区分不同套接字而设置的,因此无法将1个端口号分配给不同的套接字。端口号由16位构成,可分配的端口号范围是0-65535。但0-1023是知名端口,一般分配给特定应用程序。虽然端口号不能重复,但TCP套接字和UDP套接字不会共用端口号,所以允许重复。例如:如果某TCP套接字使用9190号端口,则其他TCP套接字就无法使用该端口号,但UDP套接字可以使用。
数据传输目标地址同时包含IP地址和端口号。
地址信息的表示
- 表示IPv4地址的结构体
此结构体作为地址信息传递给bind函数
struct sockaddr_in
{
sa_family_t sin_family; //地址族
uint16_t sin_port; //16位TCP/UDP端口号
struct in_addr sin_addr; //32位IP地址
char sin_zero[8]; //不使用
}
该结构体中的另一个结构体in_addr定义如下,它用来存放32位IP地址。
struct in_addr
{
In_addr_t s_addr; //32位IPv4地址
}
- 成员sin_family
每种协议族适用的地址族均不同。比如,IPv4使用4字节地址族,IPv6使用16字节地址族。
AF_INET IPv4网络协议中使用的地址族
AF_INET6 IPv6网络协议中使用的地址族
AF_LOCAL 本地通信中采用的UNIX协议的地址族
- 成员sin_port
该成员以网络字节序保存16位端口号
- 成员sin_addr
该成员以网络字节序保存32位IP地址信息
网络字节序与地址变换
CPU向内存中保存数据的方式有两种,这意味着CPU解析数据的方式也有两种:
- 大端序:高位字节存放到低位地址
- 小端序:高位字节存放到高位地址
例如int类型数0x12345678
大端序字节表示:0x12 0x34 0x56 0x78
小端序字节表示:0x78 0x56 0x34 0x12
整数0x12345678中,0x12是最高位字节,0x78是最低位字节。因此大端序中高位字节0x12放到低位地址,小端序中0x78放到低位地址。
目前主流的Intel系列CPU以小端序方式保存数据,在通过网络传输数据时约定同一方式,这种约定称为网络字节序,统一为大端序。因此先把数据数组转化为大端序格式再进行网络传输。
下面是字节序转换函数:
unsigned short htons(unsigned short);
unsigned short ntohs(unsigned short);
unsigned long htonl(unsigned long);
unsigned long ntohl(unsigned long);
htons中的h代表主机(host)字节序
htons中的n代表网络(network)字节序
htons解释为把short型数据从主机字节序转化为网络字节序
ntohs解释为把short型数据从网络字节序转化为主机字节序
网络地址初始化
下面函数将字符串形式的IP地址转换为32位整数型地址
#include<arpa/inet.h>
in_addr_t inet_addr(const char * string);
成功时返回32位大端序整数型值,失败时返回INADDR_NONE
inet_aton函数与inet_addr函数在功能上完全相同,也将字符串形式IP地址转换为32位网络字节序整数并返回,该函数利用了in_addr结构体。
#include<arpa/inet.h>
int inet_aton(const char * string,struct in_addr * addr);
成功时返回1,失败时返回0
string:含有需转换的IP地址信息的字符串地址值
addr:将保存转换结果的in_addr结构体变量的地址值
inet_ntoa函数与inet_aton相反,可以把网络字节序整数型IP地址转换成字符串形式
#include<arpa/inet.h>
char * inet_ntoa(struct in_addr adr)
成功时返回转换的字符串地址值,失败时返回-1
返回字符串地址值意味着字符串以保存到内存空间,但该函数未向程序员要求分配内存,而是在内部申请了内存并保存了字符串,调用完该函数后应立即将字符串复制到其他内存空间。
网络地址初始化方法:
struct sockaddr_in addr;
char * serv_ip="211.217.168.13"; //声明IP地址字符串
char * serv_port="9190"; //声明端口号字符串
memset(&addr,0,sizeof(addr)); //结构体变量addr的所有成员初始化为0
addr.sin_family=AF_INET; //指定地址族
addr.sin_addr.s_addr=inet_addr(serv_ip); //基于字符串的IP地址初始化
addr.sin_port=htons(atoi(serv_port)); //基于字符串的端口号初始化