在进行Chunked编码传输时,在回复消息的头部有Transfer-Encoding:chunked,表示将用Chunked编码传输内容,如:
chunked编码的HTTP头:
HTTP/1.1 200 OK..Date: Mon, 16 Jul 2012 17:57:52 GMT..Server: Apache..Keep-Alive: timeout=15, max=100..Connection: Keep-Alive..Transfer-Encoding: chunked..
Content-Type: text/xml....4fe9..<?xml version='1.0' e......
普通的HTTP头:
HTTP/1.1 200 OK..Date: Mon, 16 Jul 2012 06:57:57 GMT..Server: Apache/2.2.3 (CentOS)..X-Powered-By: PHP/5.1.6..Content-Length: 6415..Connection: close..Conte
nt-Type: text/xml;charset=gbk....<?xml version='1.0'encoding='GBK'?>
编码使用若干个Chunk组成,由一个标明长度为0的chunk结束,每个Chunk有两部分组成,第一部分是该Chunk的长度和长度单位(一般不写),第二部分就是指定长度的内容,每个部分用CRLF(即:\r\n回车换行)隔开。在最后一个长度为0的Chunk中的内容是称为footer的内容,是一些没有写的头部内容。
解析chunked编码的http消息内容,代码如下:
//过滤掉每个chunk的长度信息bool HttpDownload::Format(string &szData)
{
string szRet;
int nPos1 = 0;
while (1)
{
size_t nPos2 = szData.find("\r\n", nPos1);
if (nPos2 <= nPos1)
{
return false;
}
DWORD dwLen = 0; //用4个字节表示chunked内容的长度,16进制
sscanf_s(szData.substr(nPos1, nPos2 - nPos1).c_str(), "%x", &dwLen);
if (0 == dwLen)
{
//结束标记符,标示数据接收完整
szData = szRet;
return true;
}
if (szData.length() - nPos2 < (size_t)(dwLen + 4))
{
return true;
}
szRet.append(szData.begin() + nPos2 + 2, szData.begin() + nPos2 + 2 + dwLen); //2个字节表示\r\n的长度。
nPos1 = nPos2 + dwLen + 4;
}
return false;
}