1、简述
最近简单看了一下关于HTTP请求方面的知识,之前一直用Qt来实现,有专门HTTP请求的QNetworkAccessManager类来处理,实现也比较简单,这里主要讲解一下用C++代码来实现HTTP 的Get/Post请求。
一个HTTP请求报文由请求行(request line)、请求头(header)、和请求数据3个部分组成,注意请求头部分和请求数据中间需要加上“\r\n”。下图给出了请求报文的一般格式。
(1)请求行
请求行包括请求方法、URL、和HTTP协议版本三个部分。
HTTP协议的请求方法有GET、POST、HEAD、PUT、DELETE、OPTIONS、TRACE、CONNECT。这里介绍最常用的GET方法和POST方法。
GET:当客户端要从服务器中读取文档时,使用GET方法。GET方法要求服务器将URL定位的资源放在响应报文的数据部分,回送给客户端。使用GET方法时,请求参数和对应的值附加在URL后面,利用一个问号(“?”)代表URL的结尾与请求参数的开始,传递参数长度受限制。例如,/index.jsp?id=100&op=bind。
POST:当客户端给服务器提供信息较多时可以使用POST方法。POST方法将请求参数封装在HTTP请求数据中,以名称/值的形式出现,可以传输大量数据,可用来传送文件。
(2)请求头部
请求头部由关键字/值对组成,每行一对,关键字和值用英文冒号“:”分隔。请求头部通知服务器有关于客户端请求的信息,典型的请求头有:
User-Agent:产生请求的浏览器类型。
Accept:客户端可识别的内容类型列表。
Host:请求的主机名,允许多个域名同处一个IP地址,即虚拟主机。
(3)关于请求头与请求数据中间的空行
请求头之后是一个空行,需要添加 回车符和换行符——“\r\n”,通知服务器以下不再有请求头。
对于一个完整的http请求来说空行是必须的,否则服务器会认为本次请求的数据尚未完全发送到服务器,处于等待状态。
(4)请求数据
请求数据用于Post方法中。与请求数据相关的最常使用的请求头是Content-Type和Content-Length。
2、代码之路
发送Get请求
BOOL GetIpByDomainName(char *szHost, char* szIp)
{
WSADATA wsaData;
HOSTENT *pHostEnt;
int nAdapter = 0;
struct sockaddr_in sAddr;
if (WSAStartup(0x0101, &wsaData))
{
printf(" gethostbyname error for host:\n");
return FALSE;
}
pHostEnt = gethostbyname(szHost);
if (pHostEnt)
{
if (pHostEnt->h_addr_list[nAdapter])
{
memcpy(&sAddr.sin_addr.s_addr, pHostEnt->h_addr_list[nAdapter], pHostEnt->h_length);
sprintf(szIp, "%s", inet_ntoa(sAddr.sin_addr));
}
}
else
{
// DWORD dwError = GetLastError();
// CString csError;
// csError.Format("%d", dwError);
}
WSACleanup();
return TRUE;
}
void sendGetRequest()
{
//开始进行socket初始化;
WSADATA wData;
::WSAStartup(MAKEWORD(2,2),&wData);
SOCKET clientSocket = socket(AF_INET,1,0);
struct sockaddr_in ServerAddr = {0};
int Ret=0;
int AddrLen=0;
HANDLE hThread=0;
char *bufSend = "Get /check?+参数 HTTP/1.1\r\n"
"Connection:Keep-Alive\r\n"
"Accept-Encoding:gzip, deflate\r\n"
"Accept-Language:zh-CN,en,*\r\n"
"host:www.baidu.com\r\n"
"User-Agent:Mozilla/5.0\r\n\r\n";
char addIp[256] = {0};
GetIpByDomainName("www.baidu.com" , addIp);
ServerAddr.sin_addr.s_addr = inet_addr(addIp);
ServerAddr.sin_port = htons(80);;
ServerAddr.sin_family = AF_INET;
char bufRecv[3069] = {0};
int errNo = 0;
errNo = connect(clientSocket,(sockaddr*)&ServerAddr,sizeof(ServerAddr));
if(errNo==0)
{
//如果发送成功,则返回发送成功的字节数;
if(send(clientSocket,bufSend ,strlen(bufData),0)>0)
{
cout<<"发送成功\n";;
}
//如果接受成功,则返回接受的字节数;
if(recv(clientSocket,bufRecv,3069,0)>0)
{
cout<<"接受的数据:"<<bufRecv<<endl;
}
}
else
{
errNo=WSAGetLastError();
}
//socket环境清理;
::WSACleanup();
}
发送Post请求
/ post请求只需将上面的代码替换一下就可以使用
char *bufSend = "POST /check HTTP/1.1\r\n"
"Connection:Keep-Alive\r\n"
"Accept-Encoding:gzip, deflate\r\n"
"Accept-Language:zh-CN,en,*\r\n"
"Content-Length:114\r\n"
"Content-Type:application/x-www-form-urlencoded; charset=UTF-8\r\n"
"host:tmalarm.vemic.com\r\n"
"User-Agent:Mozilla/5.0\r\n\r\n"
"请求数据\r\n\r\n";
Post 请求也可以将请求数据写在请求行中,跟Get请求一样。
关于是否成功发送 Get/Post 请求
我们可以借助抓包工具看 我们发送的请求是否成功 ,可以去网上下载 HttpAnalyzerStdV7软件进行抓包,由返回的结果得出是否请求成功。
关于发送请求中 请求数据或者请求参数带 中文字符 出现乱码
我们程序中编码格式一般为Unicode编码,与HTTP服务器(UTF-8)所用编码不一样,这里就需要给中文字符转换编码格式。
关于Unicode 编码与 UTF-8编码问题 可以看一下这篇文章 C++中 Unicode 与 UTF-8 编码互转 。
char *bufSend = "Get /check?&name=%s&password=%s HTTP/1.1\r\n"
"Connection:Keep-Alive\r\n"
"Accept-Encoding:gzip, deflate\r\n"
"Accept-Language:zh-CN,en,*\r\n"
"host:www.baidu.com\r\n"
"User-Agent:Mozilla/5.0\r\n\r\n";
CString cStrName = L"前行中的小猪";
const char* cName;
// UnicodeToUtf8方法将Unicode编码转为UTF-8格式。
cName = UnicodeToUtf8(cStrName);
char* passWord = "123456";
char bufData[400] = {0};
sprintf_s(bufData , 400 , bufSend , cName , passWord);
//这里最终将中文转为UTF-8格式的结果保存在 bufData 数组中。
// Unicode 转 UTF-8
char* UnicodeToUtf8(const wchar_t* unicode)
{
int len;
len = WideCharToMultiByte(CP_UTF8, 0, unicode, -1, NULL, 0, NULL, NULL);
char *szUtf8 = (char*)malloc(len + 1);
memset(szUtf8, 0, len + 1);
WideCharToMultiByte(CP_UTF8, 0, unicode, -1, szUtf8, len, NULL, NULL);
return szUtf8;
}