进行Chunked编码传输的HTTP Response会在消息头部设置:
Transfer-Encoding: chunked
表示Content Body将用Chunked编码传输内容。
Chunked编码使用若干个Chunk串连而成,由一个标明长度为0的chunk标示结束。每个Chunk分为头部和正文两部分,头部内容指定下一段正文的字符总数(十六进制的数字)和数量单位(一般不写),正文部分就是指定长度的实际内容,两部分之间用回车换行(CRLF)隔开。在最后一个长度为0的Chunk中的内容是称为footer的内容,是一些附加的Header信息(通常可以直接忽略)。具体的Chunk编码格式如下:
Chunked-Body = *chunk
"0" CRLF
footer
CRLF
chunk = chunk-size [ chunk-ext ] CRLF
chunk-data CRLF
hex-no-zero = <HEX excluding "0">
chunk-size = hex-no-zero *HEX
chunk-ext = *( ";" chunk-ext-name [ "=" chunk-ext-value ] )
chunk-ext-name = token
chunk-ext-val = token | quoted-string
chunk-data = chunk-size(OCTET)
footer = *entity-header
RFC文档中的Chunked解码过程如下:
length := 0
read chunk-size, chunk-ext (if any) and CRLF
while (chunk-size > 0) {
read chunk-data and CRLF
append chunk-data to entity-body
length := length + chunk-size
read chunk-size and CRLF
}
read entity-header
while (entity-header not empty) {
append entity-header to existing header fields
read entity-header
}
Content-Length := length
Remove "chunked" from Transfer-Encoding
最后提供一段PHP版本的chunked解码代码:
$chunk_size = (integer)hexdec(fgets( $socket_fd, 4096 ) );
while(!feof($socket_fd) && $chunk_size > 0) {
$bodyContent .= fread( $socket_fd, $chunk_size );
fread( $socket_fd, 2 ); // skip /r/n
$chunk_size = (integer)hexdec(fgets( $socket_fd, 4096 ) );
}
==========================================================
通常,HTTP协议中使用Content-Length这个头来告知数据的长度。然后,在数据下行的过程中,Content-Length的方式要预先在服务器中缓存所有数据,然后所有数据再一股脑儿地发给客户端。
如果要一边产生数据,一边发给客户端,WEB 服务器就需要使用"Transfer-Encoding: chunked"这样的方式来代替Content-Length。
"Transfer-Encoding: chunked"是这样编码的:
HTTP头
\r\n
\r\n --连续的两个\r\n之后就是HTTP体了
16进制值代表的数据长度
\r\n
上面所指的数据长度
\r\n --每段数据结束后,以\r\n标识
16进制代表的第二段数据
\r\n
XX长度的数据
\r\n
………… (反复通过这样的方式表示每次传输的数据长度)
0 --数据结束部分用0表示,然后是连续的两个\r\n
\r\n
\r\n
下面的代码演示和如何解析"Transfer-Encoding: chunked"的数据:
//test_chunked.cpp
#include <stdio.h>
#include <string.h>
int Hex2Int(const char* str)
{
int nResult = 0;
while (*str!='\0')
{
switch (*str)
{
case '0'...'9':
nResult = nResult*16 + *str-'0';
break;
case 'a'...'f':
nResult = nResult*16 + *str-'a'+10;
break;
case 'A'...'F':
nResult = nResult*16 + *str-'A'+10;
break;
default:
return -1;
break;
}
str++;
}
return nResult;
}
#define COPY_STRING(dst, src, src_len) do{memcpy((dst), (src), (src_len)); dst[(src_len)]='\0';}while(0);
void test(const char* file)
{
//
const int BUFFER_SIZE = 1024*10;
char* buf = new char[BUFFER_SIZE];
FILE* fp = fopen(file, "rb");
if (NULL==fp)
{
printf("open file error\n");
return;
}
int nLen = fread(buf, 1, BUFFER_SIZE, fp);
fclose(fp);
fp = NULL;
buf[nLen] = '\0';
//
char* pBody = strstr(buf, "\r\n\r\n");
if (NULL==pBody)
{
return;
}
pBody += 4;
FILE* fDst = fopen("result.txt.gz", "ab");
//下面开始解析
int nBytes;
char* pStart = pBody;
char* pTemp;
char temp[10];
do
{
pTemp = strchr(pStart, '\r');
if (NULL==pTemp)
{
printf("格式错误!\n");
break;
}
nLen = pTemp-pStart;
COPY_STRING(temp, pStart, nLen);
nBytes = Hex2Int(temp);
pStart = pTemp + 2;
//下面写入到另一个文件
if (nBytes>0)
{
if (nBytes!=fwrite(pStart, 1, nBytes, fDst))
{
printf("write error!\n");
break;
}
pStart += nBytes + 2;
}
} while(nBytes>0);
fclose(fDst);
fDst = NULL;
delete[] buf;
buf = NULL;
}
int main()
{
test("chunked.txt");
return 1;
}