Tars网络包处理过程分析

最新推荐文章于 2024-08-16 08:46:09 发布

奇华智能

最新推荐文章于 2024-08-16 08:46:09 发布

阅读量1.2k

点赞数 1

分类专栏：腾讯SPP框架

腾讯SPP框架专栏收录该内容

8 篇文章 6 订阅

订阅专栏

很早就想写一篇关于Tars网络包处理的文章，但是又不知道从何写起，因为心里想着无非就是基于Linux Epoll的那一套东西，加上一些线程间的数据交互。

直到遇见了BUG！

这不是Tars框架本身的BUG，只是使用者在没有吃透Tars包处理运作机制情况下发生的BUG。

本文会围绕这个BUG从头到尾来谈谈Tars对网络包处理。

关于这一切的开始

某天正在和客户端同学调试Tars框架下WebSocket（后文称WS）通信，发现一个奇怪的现象，服务器会偶尔收不到完整的WS包，尤其是客户端在连续发送几k大小包的情况下。

我们都知道WS协议自带分包的机制，第一时间怀疑找的轮子有问题，故在解析WS协议那里排查BUG了好久，无果；接着利用tcpdump抓包发现网卡确实是收到了完整的分片包，排除客户端发包以及网络通信问题；最后补全了Debug日志努力重现BUG，发现一分为二的WS包居然被Tars塞到了二个不同的处理线程…….当时心里咯噔一下，Tars还有这种操作！

分析

现在我已经可以确定是Tars框架导致了这种结果，那么究竟里面有什么魔术？先分析一下Tars网络相关代码。

网络线程与Servant处理线程建立联系：

首先区分两个概念：

Tars网络收发数据包是独立的线程（配置文件里的<server>netthread，默认没填写，默认值1）；
Tars自实现业务是另外的线程，称为Servant线程（配置文件里<server><xxx.xxx.xxxAdapter>threads）；

Tars的自实现业务都是基于Servant，申请Servant的配置处可以填写[线程数]。

先从进程启动开始分析：

//Tars/cpp/servant/libservant/Application.cpp

void Application::main(int argc, char *argv[])

{

//...

//初始化Server部分

initializeServer();

vector<TC_EpollServer::BindAdapterPtr> adapters;

//绑定对象和端口

bindAdapter(adapters);

//...

//设置HandleGroup分组

//把对象和_epollServer相互绑定

setHandle(adapters[i]);

//启动业务处理线程

_epollServer->startHandle();

//...

}

initializeServer()中会对网络通信线程进行配置初始化，核心是创建TC_EpollServer _epollServer。

//Tars/cpp/servant/libservant/Application.cpp

void Application::initializeServer()

{

//...

//读取网络线程数，一般都是默认1

string sNetThread = _conf.get("/tars/application/server<netthread>", "1");

unsigned int iNetThreadNum = TC_Common::strto<unsigned int>(sNetThread);

//...

//初始化TC_EpollServer _epollServer

_epollServer = new TC_EpollServer(iNetThreadNum);

//...

}

在bindAdapter()中会对Servant进行配置初始化：

//Tars/cpp/servant/libservant/Application.cpp

void Application::bindAdapter(vector<TC_EpollServer::BindAdapterPtr>& adapters)

{

//...

//读取配置里设置的Servant处理线程数

bindAdapter->setHandleNum(TC_Common::strto<int>(_conf.get(sLastPath + "<threads>", "0")));

bindAdapter->setBackPacketBuffLimit(iBackPacketBuffLimit);

//_epollServer绑定Servant的对象

_epollServer->bind(bindAdapter);

//...

}

最终，Servant对象处理线程会在_epollServer->startHandle()中启动Servant线程。

经过这一系列处理，将网络收发包线程与Servant业务对象线程关系建立起来。

网络收包：
收包的过程这里不贴代码了，流程是：

NetThread收到数据包 -> 经过Connection（这里有防过载的处理）-> 转交到Adapter手上 -> 保存至recv_queue。

对于收包几个点需要清晰理解的：

默认只有1个NetThread来处理网络数据包；
一个Servant业务对应一个Adapter，NetThread管理着连接列表ConnectionList，列表里的Connection保存有Adapter的指针；
一个Adapter只有一个recv_queue，它是一个线程安全的双端队列（实现机制就是粗暴了加锁）；

Servant处理线程：

处理线程的核心循环在Tars/cpp/servant/libservant/ServantHandle.cpp这个文件中实现：