最近在学习c++项目的时候,发现对于网络编程的知识基本上已经忘完了,所以现开始重新学习网络编程相关的知识。
本篇博客的内容主要来自于尹圣雨的《TCP&IP网络编程》
还在不断更新中......
套接字Socket
创建方法:
成功的时候会返回文件描述符 失败返回-1
其中domain 代表套接字中所用的协议簇,type代表套接字数据传输类型信息,protocol代表计算机通信中使用的协议信息。
#include <sys/socket. h>
int socket(int domain, int type, int protocol);
协议簇
协议簇介绍(位于头文件sys/socket.h中):
一般我们填用PF_INET,但是一般最后采用的协议是通过socket中的第三个参数决定的
套接字类型
SOCK_STREAM
SOCK_DGRAM
3.传输的数据有数据边界
4.限制每次传输的数据大小
面向消息的套接字不存在连接的概念,是不可靠的,不按序传递的。
协议的最终选择
一般来说填写0就可以。
如果说数据的传输方式相同,但协议不同。此时需要通过第三个参数具体指定协议信息
例如:
int tcp_socket = socket(PF_INET,SOCK_STREAM,IPPROT_TCP);
bind
bind可以理解为安装电话机中的分配电话号码(IP地址和端口号)。
#include <sys/socket.h>
int bind(int sockfd , struct sockaddr *myaddr, socklen addrlen)j
成功时会返回0,失败返回-1
listen
listen可以理解为安装电话线(这样才是 可请求状态)
#include <sys/socket.h>
int listen(int sockfd , int backlog);
accept
accept相当于拿起电话进行对话(接受了对方的连接请求)
#include <sys/socket.h>
int accept(int sockfd, struct sockaddr *addr... socklen_t *addrlen);
所以网络编程中接受连接请求的套接字创建过程如下:
网络相关知识
IP用来区分不同的计算机,而端口号用来区分计算机不同的应用程序
表示 IPv4 地址的结构体
网络字节序与地址变换
有些cpu会以这种顺序保存在内存中
大端序
小端序
高位字节存放到高位地址
eg:
0X12是高位字节 存在在了高位地址
所以为了解决上述的问题,统一了网络传输数据的方式,即采用大端序,也叫网络字节序。
字节序转换
转换函数:
htons中的h代表主机字节序,n代表网络字节序。(即Host Network)
注意:Linux中Long类型占据4个字节
一般来说 前面两个short类型一般回用于端口号的转换,而Long类型用于IP地址的转换。
网络地址的初始化与分配
成功的时候会返回32位大端序的整数型值,失败返回INADDR_NONE。
#include <arpa/inet.h>
in_addr_t inet_addr(const char * string);
该函数能够帮助我们将字符串形式的IP地址转为32位整形数据,并且最终还是网络字节序。
inet_aton与inet_addr功能上完全相同,但是该函数使用了in_addr结构体,且使用频率更高。
addr ->将保存转换结果的32为网络字节序整数地址值
#include <arpa/inet.h>
int inet_aton(const char * string,struct in_addr * addr);
在实际的编程中,若使用inet_addr函数还需将转换后的IP地址带入sockaddr_in结构体中声明的in_addr结构体变量。而使用inet_aton函数则不要这一步。
所以建议使用inet_aton函数
还有一个逆向的inet_aton函数,即:
#include <arpa/inet.h>
char* inet_ntoa(struct in_addr adr) ;
成功的时候返回我们所熟知的IP地址形式了,失败则会返回-1
看名字也知道是将网络字节序转为字符串型的IP地址
注意:
讲了这么多,现在开始初始化网络地址:
struct sockaddr_in addr;
char *serv_ip = "211.117.168.13";
char * serv_port = "9190";
memset(&addr,0 , sizeof(addr));
addr.sin_family = AF_ INET;
addr.sin_addr.s_addr = inet_addr(serv_ip);
addr.sin_port = htons(atoi(serv_port));
这里的meset函数代表将结构体变量addr的所有成员初始化为0,这样做是为了将sin_zero初始化为0。
atoi函数将字符串类型的值转为整数型。
向套接字分配网络地址
#include <sys/socket.h>
int bind(int sockfd, struct sockaddr * myaddr, socklen_t addrlen);
bind负责会服务端套接字分配IP地址和端口号
eg:
int serv_sock;
struct sockaddr_in serv_addr;
char * serv_port="9190";
serv_sock = socket(PF_INET,SOCK_STREAM,0);
memset(&serv_addr, 0, sizeof(serv_addr));
serv_addr.sin_family = AF_INET;
serv_addr.sin_addr.s_addr = htonl(INADDR_ANY);
serv_addr.sin_port = htons(atoi(serv_port));
bind(serv_sock, (struct sockaddr * )&serv_addr,sizeof(serv_addr));
注意这里的bind函数中的第二个参数 进行了强制类型转换(struct sockaddr * ) 因为我们传入的类型为:struct sockaddr_in。
TCP/IP协议栈
链路层
主要是为了负责定义LAN WAN MAN等网络标准,即负责物理连接
IP层
TCP层(传输层)
TCP是可靠的信息传输。
应用层
根据程序特点决定服务器端和客户端之间的数据传输规则。
实现基于TCP的服务器端/客户端
下图是TCP服务器端默认的函数调用顺序,绝大部分TCP服务器端都按照该顺序调用:
在我们定义了套接字后并通过bind函数分配了IP地址和端口号后,我们需要通过listen函数进入等待连接请求状态,只有使用了Listen函数,客户端才能够进入可发出连接请求的状态。之后客户端才能够调用connect函数。
服务端
代码如下:
#include <stdio.h>
#include <stdlib.h>
#include <string.h>
#include <unistd.h>
#include <arpa/inet.h>
#include <sys/socket.h>
void error_handling(char *message);
int main(int argc, char *argv[])
{
int serv_sock;
int clnt_sock;
struct sockaddr_in serv_addr;
struct sockaddr_in clnt_addr;
socklen_t clnt_addr_size;
char message[]="Hello World!";
if(argc!=2){
printf("Usage : %s <port>\n", argv[0]);
exit(1);
}
serv_sock=socket(PF_INET, SOCK_STREAM, 0);
if(serv_sock == -1)
error_handling("socket() error");
memset(&serv_addr, 0, sizeof(serv_addr));
serv_addr.sin_family=AF_INET;
serv_addr.sin_addr.s_addr=htonl(INADDR_ANY);
serv_addr.sin_port=htons(atoi(argv[1]));
if(bind(serv_sock, (struct sockaddr*) &serv_addr, sizeof(serv_addr))==-1 )
error_handling("bind() error");
if(listen(serv_sock, 5)==-1)
error_handling("listen() error");
clnt_addr_size=sizeof(clnt_addr);
clnt_sock=accept(serv_sock, (struct sockaddr*)&clnt_addr,&clnt_addr_size);
if(clnt_sock==-1)
error_handling("accept() error");
write(clnt_sock, message, sizeof(message));
close(clnt_sock);
close(serv_sock);
return 0;
}
void error_handling(char *message)
{
fputs(message, stderr);
fputc('\n', stderr);
exit(1);
}
客户端
客户端调用connet函数后,发生以下情况才会返回:
1.服务器端接受连接请求
2.发生断网等异常情况而中断连接请求
客户端代码如下
#include <stdio.h>
#include <stdlib.h>
#include <string.h>
#include <unistd.h>
#include <arpa/inet.h>
#include <sys/socket.h>
void error_handling(char *message);
int main(int argc, char* argv[])
{
int sock;
struct sockaddr_in serv_addr;
char message[30];
int str_len;
if(argc!=3){
printf("Usage : %s <IP> <port>\n", argv[0]);
exit(1);
}
sock=socket(PF_INET, SOCK_STREAM, 0);
if(sock == -1)
error_handling("socket() error");
memset(&serv_addr, 0, sizeof(serv_addr));
serv_addr.sin_family=AF_INET;
serv_addr.sin_addr.s_addr=inet_addr(argv[1]);
serv_addr.sin_port=htons(atoi(argv[2]));
if(connect(sock, (struct sockaddr*)&serv_addr, sizeof(serv_addr))==-1)
error_handling("connect() error!");
str_len=read(sock, message, sizeof(message)-1);
if(str_len==-1)
error_handling("read() error!");
printf("Message from server: %s \n", message);
close(sock);
return 0;
}
void error_handling(char *message)
{
fputs(message, stderr);
fputc('\n', stderr);
exit(1);
}
基于TCP的服务器端/客户端函数调用关系
如果说客户端在调用connect函数之前,服务器先调用了accept函数,此时客户端会进入阻塞状态直到客户端使用connect函数
优雅地断开TCP连接
TCP中的断开连接过程比建立连接过程更加重要,因为连接过程一般不会出现 太大的变数,而断开过程有可能出现预想不到的情况,
例如:
主机A正在向主机B传输数据,主机A传完自己的数据后 采用close()函数断开了连接,但是此时主机B也正在传输数据给主机A,那么就可能会遇到主机A的数据还并未到达主机B就被销毁了,所以我们要避免这种情况。
shutdown()函数
shutdown()
成功返回0 失败返回-1
注:howto代表传递断开方式信息
可能的参数有:
#include <sys/socket.h>
int shutdown(int sock, int howto);
eg: 若我们第二个参数填写SHUT_RD,则代表断开输入流 套接字将不能够接收数据,即使输入到输入缓冲中也会被抹去。
域名
域名可以说是虚拟地址,例如百度的ip地址是1.2.3.4。但我们平常不会输入ip地址去访问,而是会通过www.baidu.com去访问。
所有计算机中都记录着默认的DNS服务器地址,我们就是通过这个默认DNS服务器得到相应域名的IP地址信息。
IP地址与域名之间的转换
为什么需要?
因为当我们客户端接入服务器的时候,如果我们要求客户端输入IP地址和端口号来接入,这显然是不现实的。
那如果考虑直接将IP地址和端口号写入源码源码中呢?这样虽然看似可行,但是有个问题,因为IP的IP可能随时在改变。
所以我们考虑使用域名,因为一个域名一旦注册是很难会在变化的。
使用gethostbyname()可以通过传入字符串形式的域名获取IP地址
成功时返回hostent结构体地址,失败返回NULL指针。
#include <netdb.h>
struct hostent * gethostbyname(const char* hostname);
hostent结构体定义如下:
struct hostent
{char * h_name ;
char ** h_aliases;
int h_addrtype;
int h_length;
char ** h_addr_list;
}
下面对变量进行解释
h_name:官方域名,代表某一主页。
h_aliases:可以通过多个域名访问同一主页。同一IP可以绑定多个域名。
h_addrtype:该函数不仅支持IPV4,同时支持IPV6。如果是IPV4,则此变量存有AF_INET。
h_length:保存IP地址长度 IPV4->4字节 IPV6->16字节
h_addr_list:最重要的成员,通过次变量以整数形式保存域名对应的IP地址。