项目地址:https://github.com/lanofblue/SimpleWebServer
本文实现的文件在源码中的SimpleWebServer/client_and_server
目录下
本文内容:获取来自客户端的HTTP请求报文
-
目标:获取来自客户端的HTTP请求报文
-
客户端与服务器的通信
- 套接字概述
- 套接字描述符
- 字节序
- 套接字概述
-
客户端如何与服务器建立连接
- 客户端主动发起连接请求
- 服务器监听来自客户的连接
- 服务器接受来自客户端的连接请求
- 客户端向服务器发送数据
- 客户端关闭连接
-
客户端与服务器通信实战
-
一个简单的客户端程序
-
一个简单的服务器程序
-
-
获取来自客户端(浏览器)的HTTP请求报文
通过上一篇文章,我们已经知道浏览器与Web服务器的通信过程。那么我们要解决的第一个问题就是获取来自客户端的HTTP请求报文
要获取客户的HTTP请求,我们首先要了解一下客户端是如何与客户端进行通信的
客户端与服务器的通信
客户端与服务器之间的通信本质上是不同计算机(通过网络相连接)上的进程间的相互通信。
套接字概述
进程使用套接字网络进程间通信接口能够和其他进程通信,无论它们是在同一台计算机还是在不同的计算机上
套接字描述符
套接字是通信端点的抽象。正如使用文件描述符访问文件,应用程序用套接字描述符访问套接字
调用socket
函数可以创建一个套接字
#include <sys/socket.h>
int socket(int domain, int type, int protocol);
参数 | 描述 |
---|---|
domain | 通信的特性 (在此项目中指定为 AF_INET ,即IPv4因特网域) |
type | 确定套接字的类型 (在此项目中指定为``SOCK_STREAM`, 即有序、可靠、双向、面向连接的字节流) |
protocol | 通常是0 表示由 domain 和type 选择的默认协议 |
字节序
TCP/IP协议栈使用大端字节序(也称网络字节序),而大部分计算机采用小端字节序(也称主机字节序),因此,使用TCP/IP协议发送数据前,我们需要把主机字节序转换为网络字节序,同样的,接收到数据后,我们需要把网络字节序转换为主机字节序
socket提供了以下几个API
unit32_t htonl(unit32_t host_int32); // host to net long
unit16_t htons(unit16_t host_int16); // host to net short
unit32_t ntohl(unit32_t net_int32); // net to host long
unit32_t ntohl(unit16_t net_int16); // net to host short
客户端与服务器建立连接
客户遍布在世界各地,服务器并不知道客户的地址。而上面提到,服务器需要给接受客户端请求的服务器套接字关联上一个众所周知的地址,以便客户端来访问服务器。因此,连接的发起都是由客户端主动向服务器发起连接请求。服务器通过listen
调用来监听客户发起的请求,被动接受连接
总体流程
客户端发起连接
如果要处理一个面向连接的网络服务,那么在开始交换数据之前,需要在请求服务的进程套接字(客户端)和提供服务的进程套接字(服务器)之间建立一个连接。
客户端使用connect
系统调用来主动与服务器建立连接。
#include <sys/types.h>
#include <sys/socket.h>
int connect(int sockfd, const struct sockaddr* serv_addr, socklen_t addrlen);
参数 | 描述 |
---|---|
socketfd | 由socket 系统调用返回一个socket |
serv_addr | 服务器监听的socket地址 |
addrlen | 指定监听地址的长度 |
connect
成功时返回0,一旦成功建立连接,sockfd
就唯一地标识了这个连接,**客户端就可以通过读写sockfd
**来与服务器通信。
connect
失败返回-1,并设置errno
常见的errno值 | 描述 |
---|---|
ECONNREFUSED | 目标端口不存在,连接被拒绝 |
ETIMEDOUT | 连接超时 |
服务器监听来自客户的连接
将套接字与地址关联
对于服务器,需要给接受客户端请求的服务器套接字关联上一个众所周知的地址,以便客户端来访问服务器。
使用bind
函数来关联地址和套接字
#include <sys/socket.h>
int bind(int sockfd, const struct sockaddr *addr, socklen_t len);
若成功则返回0,失败返回-1
监听队列
服务器创建的socket与服务器地址关联后,还不能马上接受客户连接,我们需要使用listen
系统调用来创建监听队列以存放待处理的客户连接:
#include <sys/socket.h>
int listen(int sockdf, int backlog);
服务器接受来自客户端连接请求
下面的系统调用从listen监听队列中接受一个连接:
#include <sys/types.h>
#include <sys/socket.h>
int accept(int sockfd, struct sockaddr* addr, socklen_t* addrlen);
客户端向服务器发送数据
socket编程接口提供了几个专门用于socket数据读写的系统调用,其中用于TCP数据读写的系统调用是
#include <sys/types.h>
#include <sys/socket.h>
ssize_t send(int sockfd, const void* buf, size_t len, int flags);
ssize_t recv(int sockfd, void* buf, size_t len, int flags);
send
send
往sockfd上写数据
参数 | 描述 |
---|---|
sockfd | 待写入数据的sockfd |
buf | 写缓冲区的位置 |
len | 写缓冲区的大小 |
flags | 提供额外的控制,通常设置为0 |
send
成功时返回实际写入的数据的长度,失败则返回-1,并设置errno
recv
recv
读取sockfd上的数据
buf
和len
分别指定读缓冲区的位置和大小,flags参数通常设置为0。
recv
成功时返回实际读入的数据的程度,失败时返回-1,并设置errno
客户端关闭连接
关闭连接实际上就是关闭该连接对应的socket。这可以通过如下关闭普通文件描述符的系统调用来实现
#include <unistd.h>
int close(int fd);
客户端与服务器通信实战
下面的客户端向服务器发送"Hello World",服务器接受到客户端的信息并输出
一个简单的客户端demo
#define BUFFER_SIZE 1024
/**
* @brief 一个简单的客户端程序
* @param argv[0] 程序名
* @param argv[1] 点分十进制的服务器IP地址
* @param argv[2] 服务器提供该服务的端口号
*/
int main(int argc, char* argv[]) {
if (argc <= 2 ) {
printf("usage: %s ip_address port_number\n", basename(argv[0]));
return 1;
}
const char* ip = argv[1]; // 服务器的点分十进制的IP地址,e.g:192.168.10.233
int port = atoi(argv[2]); // 服务器提供服务的端口号
struct sockaddr_in server_address;
bzero(&server_address, sizeof(server_address));
server_address.sin_family = AF_INET; // 选择IPv4地址族
inet_pton(AF_INET, ip, &server_address.sin_addr); // 将点分十进制的IP地址转换为二进制的地址并写入server_address
server_address.sin_port = htons(port);
// 创建客户端的socket
int sockfd = socket(PF_INET, SOCK_STREAM, 0); // 选择IPv4协议族,数据传输方式为流
assert(sockfd >= 0);
// 客户端连接服务器
if (connect(sockfd, (struct sockaddr*)&server_address, sizeof(server_address)) < 0) {
// 若创建失败,则关闭socket,结束进程
printf("connection failed\n");
close(sockfd);
return 1;
}
// 客户端发送数据
char buf[BUFFER_SIZE] = "Hello World\n";
send(sockfd, buf, strlen(buf), 0);
// 客户端关闭连接
close(sockfd);
return 0;
}
一个简单的服务器demo
#define BUFFER_SIZE 1024
/**
* @brief 一个简单的服务器程序
* @param argv[0] 程序名
* @param argv[1] 点分十进制的服务器IP地址
* @param argv[2] 服务器提供该服务的端口号
*/
int main(int argc, char* argv[]) {
if (argc <= 2 ) {
printf("usage: %s ip_address port_number\n", basename(argv[0]));
return 1;
}
/* 设置服务器的监听socket */
const char* ip = argv[1]; // 服务器的点分十进制的IP地址,e.g:192.168.10.233
int port = atoi(argv[2]); // 服务器提供服务的端口号
int ret = 0;
struct sockaddr_in server_address;
bzero(&server_address, sizeof(server_address));
server_address.sin_family = AF_INET; // 选择IPv4地址族
inet_pton(AF_INET, ip, &server_address.sin_addr); // 将点分十进制的IP地址转换为二进制的地址并写入server_address
server_address.sin_port = htons(port); // 服务器提供该服务的端口号
// 创建用于监听客户端连接的fd
int listenfd = socket(PF_INET, SOCK_STREAM, 0);
assert(listenfd >= 0);
// 将监听socket绑定到port端口上,也就是说服务器将使用该端口来监听来自客户端的请求
ret = bind(listenfd, (struct sockaddr*)&server_address, sizeof(server_address));
assert(ret != -1);
// listen函数把未连接的listenfd转换成一个被动套接字,指示内核应该接受指向该套接字的连接请求
ret = listen(listenfd, 5);
assert(ret != -1);
/* 接受来自客户端的连接请求 */
// 服务器不知道客户端何时发送请求,因此用循环不断地尝试接受来自客户端的连接
while (1) {
// 用于存储客户端地址信息的结构
struct sockaddr_in client_address;
socklen_t client_addrlength = sizeof(client_address);
// 调用accept函数来接受来自客户端的连接请求,若连接成功则connfd客户端与服务通信的文件描述符
int connfd = accept(listenfd, (struct sockaddr *) &client_address, &client_addrlength);
if (connfd < 0) { // 建立连接失败
close(connfd); // 关闭连接
continue;
}
// 连接成功则读取数据
char buf[BUFFER_SIZE];
memset(buf, '\0', sizeof(buf));
recv(connfd, buf, sizeof(buf), 0);
printf("receive: %s\n", buf);
close(connfd);
continue;
}
// 若服务器运行能至此则说明服务器错误
return 1;
}
运行结果
编译后先运行服务器程序再运行客户端程序
获取来自客户端(浏览器)的HTTP请求报文
上文我们了解了客户端与服务器的通信过程。我们知道,浏览器是一个客户端程序,当我们在浏览器中输入URL时,浏览器会向服务器自动发送HTTP请求报文,我们无需关心此过程。因此,服务器程序仅需要接收来自浏览器的数据,接收到的数据即为HTTP请求报文。
也就是说,服务器仅需要用recv()
,read()
函数,从与浏览器建立连接的套接字描述符中读取到数据,读取到的数据即为HTTP请求报文。