我们知道, tcp是流式传输的。
还是说人话吧: 客户端第一次tcp传送"123"给服务端, 第二次tcp传送“456”给服务端, 假设服务端没有及时取, 那么在服务端的内核缓冲区中就是“123456”, 根本无法分割, 这就是所谓的tcp粘包。 当然, 这只是粘包的原因之一, 还有其他原因也可能导致粘包, 先不一一说了。
服务端接收到黏在一起的包, 怎么将第一次请求和第二次请求区分开来呢? 我们来简单聊聊, 并写个简单代码示意一下。
看一下上面的例子, 无法拆分的根本原因是没有分割标识符。 如果人为定义分隔符(比如下划线), 那就成了“123_456”, 这样是否就OK呢? 很显然, 如果客户端本身要传的字符中包含下划线, 那么就会与用户分隔符的下划线冲突, 无法分割, 进入一种剪不断理还乱的状态, 那怎么办?
可以考虑在每个包前面加一个固定的头(可以用一个整数), 这个头中装有包的长度信息, 服务端先收头(整数), 然后从头中读出这个包的长度信息, 这样就实现了分割。
思路就是这样, 代码写起来也很简单,看下:
#include <iostream>
#include <string> // linux下不需要这行, 但Windows下需要
using namespace std;
int main()
{
string strBuf;
{
string s = "123";
int len = s.size();
string tmpStr((char *)&len, sizeof(int));
strBuf += tmpStr; // 头
strBuf += s; // 身
}
{
string s = "45678";
int len = s.size();
string tmpStr((char *)&len, sizeof(int));
strBuf += tmpStr; // 头
strBuf += s; // 身
}
// ---------------------------------------------
char szBuf[102400] = {0}; // 为了简便示意,这里假设strBuf的大小不会超过这个长度
unsigned int totalLen = strBuf.size();
for(unsigned int i = 0; i < strBuf.size(); i++)
{
szBuf[i] = strBuf[i];
}
if(totalLen <= sizeof(int))
{
printf("recv error\n");
return -1;
}
int len1 = 0;
{
memcpy((char *)&len1, szBuf, sizeof(int));
cout << len1 << endl;
if(sizeof(int) + len1 > totalLen)
{
printf("recv error 1\n");
return -2;
}
cout << strBuf.substr(sizeof(int), len1) << endl;
}
if(sizeof(int) + len1 == totalLen)
{
printf("ok, done!\n");
return 0;
}
int len2 = 0;
{
memcpy((char *)&len2, szBuf + sizeof(int) + len1, sizeof(int));
if(sizeof(int) + len1 + sizeof(int) + len2 > totalLen)
{
printf("recv error 2\n");
return -3;
}
cout << len2 << endl;
cout << strBuf.substr(sizeof(int) + len1 + sizeof(int), len2) << endl;
}
if(sizeof(int) + len1 + sizeof(int) + len2 == totalLen)
{
printf("ok, done!!!\n");
return 0;
}
printf("end\n");
return 0;
}
结果:
3
123
5
45678
ok, done!!!
在实际开发中, 也经常用类似的方法来判断收包是否完整。 要注意, 粘包只存在于tcp中, udp不会有粘包, 想想为什么?
OK, 先说到这里。