DCache-CacheServer分析（六）

最新推荐文章于 2024-05-25 09:41:14 发布

程序员柒叔

最新推荐文章于 2024-05-25 09:41:14 发布

阅读量378

点赞数

分类专栏： DCache 文章标签： DCache memcached redis 持久化分布式数据

本文链接：https://blog.csdn.net/evilstar2015/article/details/124973397

版权

DCache 专栏收录该内容

11 篇文章 3 订阅

订阅专栏

DCache支持定期将内存“脏”数据自动写入后端数据库，而且不需要编写任何一行代码。

本文介绍CacheServer回写线程(SyncThread)的功能以及处理流程。

SyncThread

功能简介

定时回写脏数据到后端db，同步“回写时间”到备机。

这是DCache的亮点功能。DChace会将未持久化的数据(注意！这里指的是未持久化到后端db)的Key的地址插入“Dirty链表”，由该线程轮询处理，将脏数据传送给对应的DbAcess服务写后端db；写入成功后，将该数据从Dirty链中删除。

这个功能只需要进行几步简单的配置就可实现，不需要开发任何代码。

配置参数解析

#每次回写时间间隔（秒）

SyncInterval=300

#回写频率, 0 表示不限制

SyncSpeed=0

#回写脏数据的线程数

SyncThreadNum=1

#回写时间（秒），即回写多久以前的数据

SyncTime=300

#屏蔽回写时间段（例：0900-1000;1600-1700）

SyncBlockTime=0000-0000

#解除屏蔽回写的脏数据比率

SyncUNBlockPercent=60

SyncInterval	扫描Dirty链表的时间间隔，由此参数控制数据同步的频率，单位秒
SyncSpeed	每次瞬时同步的最大记录数；如果超过该值，则休眠10秒再进行；配置为0时无此限制；
SyncThreadNum	同步线程数。
SyncTime	回写多久以前的数据。如在00:00:00时将数据set进内存，那么SyncTime秒后才会将数据写入后端db中。
SyncBlockTime	在这个时间段内，不写后端库。多用于业务高峰期、后端db压力大时，需要屏蔽。
SyncUNBlockPercent	在SyncBlockTime时间段内，如果内存中的脏数据大于这个比例时，SyncBlockTime失效，会立即执行回写操作。

DCache给我们提供了丰富配置能力，使用起来非常灵活，可以结合业务压力情况进行设置。

例如，某个业务表的“写”压力很大，而且后端系统还需要从db中读到实时数据，那么就可以如下设置：

#每秒扫描一次脏数据链表

SyncInterval=1

#不限制每次同步的数据量

SyncSpeed=0

#数据量太大，1个线程处理不过来，需要10个甚至更多线程并行处理

SyncThreadNum=10

#内存数据最多1秒就落库了(这是因为SyncInterval=1)

SyncTime=0

这样配置，可以保证1秒之前写入内存的数据在与表数据是一致的，满足业务要求。

注意：

SyncInterval不要设置太小，SyncThreadNum不要设置过大，否则后端db可能吃不消！不要过分追求实时性、一致性，满足业务要求即可。

线程处理逻辑

先看SyncThread源码的入口函数 run：

void* SyncThread::Run(void* arg)
{
    pthread_detach(pthread_self());
    SyncThread* pthis = (SyncThread*)arg;

    pthis->setRuning(true);

    CachePrx pMasterCachePrx;
    string sBakSourceAddr = "";

    time_t tLastDb = 0;
    while (pthis->isStart())
    {
        try
        {
            TC_ThreadPool twpool;
            twpool.init(pthis->getThreadNum());
            twpool.start();
//            TC_Functor<void, TL::TLMaker<time_t>::Result> cmd(pthis, &SyncThread::syncData);

            time_t tNow = TC_TimeProvider::getInstance()->getNow();

            if (tNow - tLastDb >= pthis->_syncDbInterval)  //这里是主循环，每_syncDbInterval秒执行一次
            {
                
                if (g_app.gstat()->serverType() == MASTER) //只有主节点才能回写数据库
                {
                    pthis->sync();  //将脏数据尾指针赋值给回写数据尾指针
//                    TC_Functor<void, TL::TLMaker<time_t>::Result>::wrapper_type fw(cmd, tNow);
                    for (size_t i = 0; i < twpool.getThreadNum(); i++) //启动SyncThreadNum个线程同时处理 
                    {
                        //核心处理逻辑在 SyncThread::syncData 中
                        twpool.exec(std::bind(&SyncThread::syncData, pthis, tNow));
                    }
                    twpool.waitForAllDone();
                    pthis->_syncTime = tNow;
                    TLOGDEBUG("SyncThread::Run, master sync data, t= " << TC_Common::tm2str(pthis->_syncTime) << endl);
                }
                else if (g_app.gstat()->serverType() == SLAVE)
                {
                    string sTmpCacheAddr = pthis->geBakSourceAddr();
                    if (sTmpCacheAddr.length() > 0)
                    {
                        if (sTmpCacheAddr != sBakSourceAddr)
                        {
                            TLOGDEBUG("MasterCacheAddr changed from " << sBakSourceAddr << " to " << sTmpCacheAddr << endl);
                            sBakSourceAddr = sTmpCacheAddr;
                            pMasterCachePrx = Application::getCommunicator()->stringToProxy<CachePrx>(sBakSourceAddr);
                        }
                        time_t tSync = pMasterCachePrx->getSyncTime(); //获取Master节点的SyncTime，即上一次的回写时间
                        pthis->_syncTime = tSync; //保存到Slave节点的内存中

                        if (tSync > 60)
                        {
                            time_t tSyncSlave = tSync - 60;
                            pthis->sync();
//                            TC_Functor<void, TL::TLMaker<time_t>::Result>::wrapper_type fw(cmd, tSyncSlave);
                            for (size_t i = 0; i < twpool.getThreadNum(); i++)
                            {
                                twpool.exec(std::bind(&SyncThread::syncData, pthis, tSyncSlave));
                            }
                            twpool.waitForAllDone();
                        }

                        TLOGDEBUG("slave sync data, t= " << TC_Common::tm2str(tSync) << " - 60" << endl);
                    }
                }
                tLastDb = tNow;
            }
            sleep(1);
        }
        catch (const TarsException & ex)
        {
            TLOGERROR("SyncThread::Run: exception: " << ex.what() << endl);
            usleep(100000);
        }
        catch (const std::exception &ex)
        {
            TLOGERROR("SyncThread::Run: exception: " << ex.what() << endl);
            usleep(100000);
        }
        catch (...)
        {
            TLOGERROR("SyncThread::Run: unkown exception: " << endl);
            usleep(100000);
        }
    }
    pthis->setRuning(false);
    pthis->setStart(false);
    return NULL;
}

关键的代码我已经添加了注释。可以看到，run干了2件事：

Master节点校准同步指针、执行回写 SyncThread::syncData；
Slave节点同步了回写时间到本地(用于判断是否可以主备切换，后续会介绍)；看代码逻辑，Slave好像也执行了回写，其实不是的，在底层函数 CacheStringToDoFunctor::sync 中有判断，只有Master会执行回写操作

再来分析下 SyncThread::syncData

void SyncThread::syncData(time_t t)
{
    time_t tBegin = TC_TimeProvider::getInstance()->getNow();

    CanSync& canSync = g_app.gstat()->getCanSync();
    while (isStart())
    {
        int iRet;
        time_t tNow = TC_TimeProvider::getInstance()->getNow();

        //今天凌晨开始的秒数
        time_t nows = (tNow + 28800) % 86400;

        //检查是否屏蔽回写
        if (_blockTime.size() > 0)
        {
            vector<pair<time_t, time_t> >::iterator it = _blockTime.begin();
            while (it != _blockTime.end())
            {
                if (it->first <= nows && nows <= it->second)
                {
                    TLOGDEBUG("[SyncThread::syncData] block sync data! " << nows << endl);
                    sleep(30);
                    break;
                }
                it++;
            }

            if (it != _blockTime.end())
                continue;
        }

        // 这里判断 回写速率，如果超过了配置的SyncSpeed，就休眠10s
        if (_syncSpeed > 0 && tBegin == tNow && _syncCount > _syncSpeed)
        {
            usleep(10000);
        }
        else
        {
            if (tBegin < tNow)
            {
                _syncCount = 0;
                tBegin = tNow;
            }

            // 底层回写，CacheServer对应的函数是 CacheStringToDoFunctor::sync
            iRet = g_sHashMap.syncOnce(t, canSync);

            if (iRet == TC_HashMapMalloc::RT_OK)
            {
                break;
            }
            else if (iRet == TC_HashMapMalloc::RT_NEED_SYNC)
            {
                _syncCount++;
            }
            else if (iRet != TC_HashMapMalloc::RT_NONEED_SYNC && iRet != TC_HashMapMalloc::RT_ONLY_KEY)
            {
                TLOGERROR("SyncThread::syncData sync data error:" << iRet << endl);
                g_app.ppReport(PPReport::SRP_CACHE_ERR, 1);
                break;
            }
        }

    }
    if (!isStart())
    {
        TLOGDEBUG("SyncThread by stop" << endl);
    }
    else
    {
        TLOGDEBUG("syncData finish" << endl);
    }
}

这个函数先判断当前时间是否在屏蔽时间(SyncBlockTime)范围内，如果不在这个范围才会进行回写；
再判断回写速率，是否超出SyncSpeed的限制；
上述条件都满足时，才会调用g_sHashMap.syncOnce进行回写处理，对应的底层处理函数是CacheStringToDoFunctor::sync

说明：

SyncUNBlockPercent只在MKVCacheServer(二级索引)中会参与判断。KVCacheServer中不考虑比率的事情。这可能是个bug。

接下来我们再来看一下核心的回写函数CacheStringToDoFunctor::sync

void CacheStringToDoFunctor::sync(const CacheStringToDoFunctor::DataRecord &data)
{
    {
        TC_ThreadLock::Lock lock(_lock);
        _syncKeys.insert(data._key);
        ++_syncCnt;
    }

    try {
        if (g_route_table.isTransfering(data._key))
        {
            //这里是数据迁移时的处理逻辑，不在这里讨论。直接看else if的正常处理流程
        }
        else if (g_app.gstat()->serverType() == MASTER  && _hasDb && g_route_table.isMySelf(data._key)) 
        {
        //到这里可以发现，只有MASTER会处理回写请求；前提是这个数据是自己分片的(isMySelf)，而且后端开启了db
            int iRet = 0;
            bool bEx = false;
            try
            {
                iRet = setDb(data); // 在这里调用了对应的dbacess服务，set数据到后端数据库

                if (iRet != eDbSucc)
                {
                    TLOGERROR("CacheStringToDoFunctor::sync error, ret = " << iRet << ", key = " << data._key << ", setDb again" << endl);
                    iRet = setDb(data);
                    if (iRet != eDbSucc)
                    {
                        TLOGERROR("CacheStringToDoFunctor::sync error, ret = " << iRet << ", key = " << data._key << endl);
                        FDLOG(_dbDayLog) << "set|" << data._key << "|Err|" << iRet << endl;
                        g_app.ppReport(PPReport::SRP_DB_ERR, 1);
                    }
                    else
                    {
                        FDLOG(_dbDayLog) << "set|" << data._key << "|Succ|" << iRet << endl;
                    }
                }
                else
                {
                    FDLOG(_dbDayLog) << "set|" << data._key << "|Succ|" << iRet << endl;
                }
            }
            catch (const TarsException & ex)
            {
                //这里的代码省略了
            }
            
        }
    }
    catch (exception& e)
    {
        TLOGERROR("CacheStringToDoFunctor::sync exception: " << e.what() << endl);
    }
    catch (...)
    {
        TLOGERROR("CacheStringToDoFunctor::sync unknown exception" << endl);
    }

    TC_ThreadLock::Lock lock(_lock);
    _syncKeys.erase(data._key);
}

核心代码已添加注释。

DCache在回写脏数据时考虑的也比较全面，当DCache在进行数据迁移的时候有独立的处理逻辑，这里我们不讨论，只看正常处理逻辑。大家要牢记重点：

回写的前提是有对接后端db；
而且存在分片的情况下每个节点只能回写属于自己分片的数据、保证不冲突；
只有Master会进行回写

总结

DCache自动持久化到DB的能力，为我们技术架构的构建提供了无限的想象力。在大多数场景下我们的应用可以只对接DCache，同步数据库的操作交给DCache来完成。相较于Redis的双写操作，这大幅提升了效率，也避免了数据一致性、失败回滚等等问题。

程序员柒叔

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
打赏
0
评论
DCache-CacheServer分析（六）

本文介绍CacheServer回写线程(SyncThread)的功能以及处理流程，帮助大家更快、更深入的了解DCache的工作原理。DCache自动持久化到DB的能力，为我们技术架构的构建提供了无限的想象力。在大多数场景下我们的应用可以只对接DCache，同步数据库的操作交给DCache来完成。相较于Redis的双写操作，这大幅提升了效率，也避免了数据一致性、失败回滚等等问题
复制链接

扫一扫