Memcache分组和同步机制的实现

作者:heiyeluren
博客:http://blog.csdn.net/heiyeshuwu   时间:2007-06-25
【Memcache同步类的实现思想】

首先我们明确了解就是Memcache是一个简单、快速、高效的分布式基于内存的缓存工具,一般用于网站等数据库数据缓存、高速交换信息的缓存,比如Session数据等等。Memcache最主要的特点就是两个:一是它是基于内存的高效Hash类缓存方式,二是使用了LUR算法来进行数据有效期控制,这两点就能够很好的满足我们的普通网站的应用。(关于Memcache的使用和协议请参考我的另一篇文章:《Memcache的使用和协议分析详解》http://blog.csdn.net/heiyeshuwu/archive/2006/11/13/1380838.aspx)

Memcache本身也存在一些不足,不能说是不足,至少是为了满足它高效的存取,所以没有去实现的功能,包括:一是本身没有内置分布式功能,无法实现使用多台Memcache服务器来存储不同的数据,最大程度的使用相同的资源;二是无法同步数据,容易造成单点故障。

那么其实都可以通过我们的Memcache的客户端程序来解决的,首先我们PHP的PECL中的Memcache扩展能够有效的解决Memcache的分布式问题,主要的接口就是 addServer() 函数,具体关于addServer()函数的实现可以参考该扩展源代码。那么现在就存在第二个问题,就是说无法同步数据,可以理解为MySQL中Master/Slave的机制,就是说如果我们有多台的Memcache服务器,使用addServer函数的话,每个服务器存储的数据都是唯一的,那么任何一台服务器宕机的话,那么这台服务器上的存储数据将丢失无法访问,这样肯定是无法充分发挥我们Memcache威力的,那么我们就需要一个方式来解决这个问题,这个就是本文主要要探讨解决的问题:关于在多台Memcache服务器中分组和同步数据的问题。

针对这个问题我构建了一个PHP写的Class,大致的思想就是把多台Memcache服务器分成两组,每组的服务器数量可能是一样的(如果总数是复数的话),数量不一样也没关系,写数据的时候往两组服务器都写,数据是一样的,那么A组服务器的数据和B组服务器的数据是一样的,如果A组服务器中某一台机器宕机了,则能够从B组服务器中提取出数据来,这样能够有效的避免单点故障,特别是在高性能要求的网站当中。当然,相应的操作也是有开销的,主要的开销在于网络连接,就是说连接到A组服务器中发现没有数据,则去访问B组服务器。另外还有就是在访问数据过程中,都是从A组开始的,那么并发量很高的情况下,A组服务器的压力比较大,那么我还实现了对A组和B组服务器随机访问的机制,如果在随机的组中没有发现数据则访问另外一个组,这样A组和B组的压力就是1/2了,能够有效的面对高负载的情况。

同样的,这个类是可以扩展的,比如你可以修改成为能够满足两组以上的服务器,但是这样逻辑会更复杂,我基于简便期间,目前就考虑了两组服务器的情况,毕竟一般公司来说,没有很多机器去做Memcache的缓存,所以两组已经能够满足大部分要求了。

PS:如果有兴趣的话,可以完全自己重新实现Memcache的addServer扩展,比如增加addGroup之类的方法,能够更有效的解决同步和分组的问题。同样的,如果想节省资源的使用,可以把Memcached当作线程的方式来运行。
【Memcache同步类的实现代码】

本类经过我大致的各种测试,运行还算稳定,当然,使用时还是请多加注意。

<?php
/**
 * Memcache 操作类 (支持同步和分组访问)
 * author     : heiyeluren <http://blog.csdn.net/heiyeshuwu>
 * created    : 2007-06-21
 * lastModifed: 2007-06-21
 */

/** * Memcache操作类 */
class MemcacheOpt
{
    //---------------------
    //  属性定义
    //---------------------
    /**     * 是否进行多组同步      */
    var $isGroup    = true;
    /**
     * 多组同步情况下是否使用减轻负载的随机存取
     */
    var $isRandom   = true;

    /** 默认的Memcache服务器端口  */
    var $mmcPort    = 11211;

    /** 保存原始组信息*/
    var $groups     = array();

    /** 保存第一、二组Memcache服务器信息*/
    var $group1     = array();
    var $group2     = array();
    /** * 保存第一、二组连接对象  */
    var $mmc1       = '';
    var $mmc2       = '';
   

    //---------------------
    //   内部操作方法
    //---------------------

    /** 显示错误信息     *
     * @param string $msg 需要显示消息的内容
     * @param string $type 消息类型,error是普通错误消息,fatal 是致命错误,将终止程序执行, message 是普通消息,缺省状


     * @return bool true
     */
    function showMessage($msg, $type){
        $msg .= " ";
        switch($type){
            case 'error':
                echo("Memcache Error: ". $msg);
                break;
            case 'fatal':
                die("Memcache Fatal: ". $msg);
                break;
            case 'message':
                echo("Memcache Message: ". $msg);
                break;
            default:
                echo("Memcache Error: ". $msg);
        }
        return true;
    }


    /**
     * 构造函数 (初始化分组和连接到服务器)
     */
    function MemcacheOpt($hostArray, $hostArray2=array()){
        if (!is_array($hostArray) || empty($hostArray)){
            $this->showMessage('Memcache host list invalid', 'fatal');
        }
        $this->groups = array_merge($hostArray, $hostArray2);
        $this->splitGroup($hostArray, $hostArray2);
        $this->connect();
    }

    /**
     * 对组进行切分 (按照是否需要分组进行相应的切分)
     *
     * @param array $hostArray 主机数组列表1
     * @param array $hostArray2 主机数组列表2
     * @return void
     */
    function splitGroup($hostArray, $hostArray2=array()){
        //如果只有一台机器则不使用分组
        if (count($hostArray) < 2 && empty($hostArray2)){  $this->isGroup = false;  }

        //使用分组
        if ($this->isGroup){
            if (is_array($hostArray2) && !empty($hostArray2)){
                $this->group1 = $hostArray;
                $this->group2 = $hostArray2;
            }else{
                $count = ceil(count($hostArray) / 2);
                $this->group1 = array_splice($hostArray, 0, $count);
                $this->group2 = array_splice($hostArray, 0);
            }
        }else{  $this->group1 = $hostArray;         }
    }

    /**     * 连接到Memcache服务器     */
    function connect(){
        if (!is_array($this->group1) || empty($this->group1)){
            $this->showMessage("Memcache host1 array invalid", 'error');
            return false;
        }

        //连接第一组Memcache服务器
        $this->mmc1 = new Memcache;
        foreach($this->group1 as $hosts){
            $tmp = explode(":", $hosts);
            $host = $tmp[0];
            $port = (!isset($tmp[1]) || $tmp[1]=='') ? $this->mmcPort : $tmp[1];
            $this->mmc1->addServer($host, $port);
        }

        //如果需要分组则连接第二组Memcache服务器
        if ($this->isGroup){
            if ( !is_array($this->group2) || empty($this->group2) ){
                $this->showMessage("Memcache host2 array invalid", 'error');
                return false;
            }
            $this->mmc2 = new Memcache;
            foreach($this->group2 as $hosts){
                $tmp = explode(":", $hosts);
                $host = $tmp[0];
                $port = (!isset($tmp[1]) || $tmp[1]=='') ? $this->mmcPort : $tmp[1];
                $this->mmc2->addServer($host, $port);
            }
        }
    }

    /**     * 关闭Memcache服务器连接     */
    function close(){
        if (is_object($this->mmc1)){            $this->mmc1->close();        }
        if (is_object($this->mmc1)){            $this->mmc1->close();        }       
        return true;
    }

    /**
     * 数据操作核心函数
     *
     * @param string $optType 操作类型,主要有 add, set, replace, delete, flush
     * @param string $key 关键字,如果是 add,set,replace,delete 需要提交key参数
     * @param string $val 关键字对应的值,如果是 add, set,replace 需要提交value参数
     * @param int $expire 数据有效期,如果是 add,set,replace需要提交expire参数
     * @return mixed 不同的需要产生不同的返回
     */
    function opt($optType, $key='', $val='', $expire=''){
        if (!is_object($this->mmc1)){
            $this->showMessage("Not availability memcache connection object", 'fatal');
        }
        if ($this->isGroup && !is_object($this->mmc2)){
            $this->showMessage("Group 2 memcache host connection object not availability", 'error');
        }

        //加入数据操作
        if ($optType=='add' || $optType=='set' || $optType=='replace'){
            $this->mmc1->set($key, $val, false, $expire);
            if ($this->isGroup && is_object($this->mmc2)){
                $this->mmc2->set($key, $val, false, $expire);
            }
            return true;
        }

        //获取数据操作
        if ($optType == 'get'){

            //缺省获取第一组数据
            if (!$this->isGroup || !is_object($this->mmc2)){
                return $this->mmc1->get($key);       
            }

            //分组情况下逐组访问
            $num = ( $this->isRandom ? rand(1, 2) : 1 );
            $obj = "mmc". $num;
            $val = $this->$obj->get($key);

            //如果没有提取到数据,则访问另外一组
            if ($val == ""){
                switch($num){
                    case 1: $val = $this->mmc2->get($key); break;
                    case 2: $val = $this->mmc1->get($key); break;
                    default: $val = $this->mmc1->get($key);
                }
            }
            return $val;
        }

        //删除数据操作
        if ($optType == 'delete'){
            $this->mmc1->delete($key, $expire);
            if ($this->isGroup && is_object($this->mmc2)){
                $this->mmc2->delete($key);       
            }
            return true;
        }

        //清空数据操作    
        if($optType == 'flush'){
            $this->mmc1->flush();
            if ($this->isGroup && is_object($this->mmc2)){
                $this->mmc2->flush();       
            }
            return true;
        }
       
    }
    //---------------------
    //   外部操作方法
    //---------------------

    //增加一个元素
    function add($key, $val, $expire=''){   return $this->opt('add', $key, $val, $expire);     }

    //增加一个元素
    function set($key, $val, $expire=''){        return $this->opt('set', $key, $val, $expire);    }

    //替换一个元素
    function replace($key, $val, $expire=''){        return $this->opt('replace', $val, $expire);    }

    //获取一个元素
    function get($key){        return $this->opt('get', $key);    }

    //删除一个元素
    function delete($key, $timeout=''){      return $this->opt('delete', $key, '', $timeout);    }

    //让所有的元素过期 (本接口不要轻易使用)
    function flush(){       return $this->opt('flush');     }


    /**     * 获取所有Memcache服务器状态     */
    function getStats(){
        $status = array();

        //单独连接到每台Memcache
        foreach($this->groups as $key=>$hosts){
            $tmp = explode(":", $hosts);
            $host = $tmp[0];
            $port = (!isset($tmp[1]) || $tmp[1]=='') ? $this->mmcPort : $tmp[1];

            $conn = new Memcache;
            $conn->connect($host, $port);
            $s = $conn->getStats();
            $s['host'] = $host;
            $s['port'] = $port;
            $status[$key] = $s;
        }
        return $status;
    }

    /**
     * 获取所有Memcache服务器版本号
     */
    function getVersion(){
        $version = array();
        $stats = $this->getStats();
        foreach($stats as $key=>$s){
            $v['host'] = $s['host'];
            $v['port'] = $s['port'];
            $v['version'] = $s['version'];
            $version[$key] = $v;
        }
        return $version;
    }

}
?>

 【Memcache同步类的测试】

在本机开启多个Memcache守护进程:

[~]$ ps auxww | grep memcached
heiyeluren  98466  0.0  0.2  6088 5676  ??  SsJ   7:50下午   0:00.04 /usr/local/memcache/bin/memcached -d -m 32 -l 10.62.240.9 -p 11214
heiyeluren  98437  0.0  0.2  6088 5676  ??  SsJ   7:50下午   0:00.04 /usr/local/memcache/bin/memcached -d -m 32 -l 10.62.240.9 -p 11213
heiyeluren  98425  0.0  0.2  6088 5676  ??  SsJ   7:50下午   0:00.05 /usr/local/memcache/bin/memcached -d -m 32 -l 10.62.240.9 -p 11212
heiyeluren  98228  0.0  0.2  6088 5676  ??  SsJ   7:48下午   0:00.05 /usr/local/memcache/bin/memcached -d -m 32 -l 10.62.240.9 -p 11211

MemcacheOpt类测试代码:

<?php
require_once("MemcacheOpt.class.php");

//操作代码
$hostArray = array("10.62.240.9", "10.62.240.9:11212", "10.62.240.9:11213", "10.62.240.9:11214");
$m = new MemcacheOpt($hostArray);

$m->add("key1", "key1_value", 30);
$m->add("key2", "key2_value", 30);
$m->set("key3", "key3_value", 30);
$m->set("key4", "key4)value", 30);

echo $m->get("key1"). " ";
echo $m->get("key2"). " ";
echo $m->get("key3"). " ";
echo $m->get("key4"). " ";

print_r($m->getStats());
print_r($m->getVersion());

?>
 

 测试代码输出结果: 

key1_value
key2_value
key3_value
key4)value
Array
(
    [0] => Array
        (
            [pid] => 98228
            [uptime] => 7440
            [time] => 1182433964
            [version] => 1.1.12
            [rusage_user] => 0.024758
            [rusage_system] => 0.034309
            [curr_items] => 5
            [total_items] => 158
            [bytes] => 265
            [curr_connections] => 3
            [total_connections] => 134
            [connection_structures] => 4
            [cmd_get] => 87
            [cmd_set] => 159
            [get_hits] => 81
            [get_misses] => 6
            [bytes_read] => 6423
            [bytes_written] => 27628
            [limit_maxbytes] => 33554432
            [host] => 10.62.240.9
            [port] => 11211
        )

    [1] => Array
        (
            [pid] => 98425
            [uptime] => 7359
            [time] => 1182433964
            [version] => 1.1.12
            [rusage_user] => 0.012727
            [rusage_system] => 0.038181
            [curr_items] => 4
            [total_items] => 119
            [bytes] => 208
            [curr_connections] => 3
            [total_connections] => 121
            [connection_structures] => 4
            [cmd_get] => 45
            [cmd_set] => 122
            [get_hits] => 45
            [get_misses] => 0
            [bytes_read] => 4492
            [bytes_written] => 22146
            [limit_maxbytes] => 33554432
            [host] => 10.62.240.9
            [port] => 11212
        )

    [2] => Array
        (
            [pid] => 98437
            [uptime] => 7356
            [time] => 1182433964
            [version] => 1.1.12
            [rusage_user] => 0.029343
            [rusage_system] => 0.022345
            [curr_items] => 4
            [total_items] => 84
            [bytes] => 213
            [curr_connections] => 3
            [total_connections] => 111
            [connection_structures] => 4
            [cmd_get] => 88
            [cmd_set] => 85
            [get_hits] => 43
            [get_misses] => 45
            [bytes_read] => 4014
            [bytes_written] => 23911
            [limit_maxbytes] => 33554432
            [host] => 10.62.240.9
            [port] => 11213
        )

    [3] => Array
        (
            [pid] => 98466
            [uptime] => 7330
            [time] => 1182433964
            [version] => 1.1.12
            [rusage_user] => 0.009188
            [rusage_system] => 0.035360
            [curr_items] => 1
            [total_items] => 53
            [bytes] => 52
            [curr_connections] => 3
            [total_connections] => 98
            [connection_structures] => 4
            [cmd_get] => 37
            [cmd_set] => 56
            [get_hits] => 28
            [get_misses] => 9
            [bytes_read] => 2437
            [bytes_written] => 21024
            [limit_maxbytes] => 33554432
            [host] => 10.62.240.9
            [port] => 11214
        )

)
Array
(
    [0] => Array
        (
            [host] => 10.62.240.9
            [port] => 11211
            [version] => 1.1.12
        )

    [1] => Array
        (
            [host] => 10.62.240.9
            [port] => 11212
            [version] => 1.1.12
        )

    [2] => Array
        (
            [host] => 10.62.240.9
            [port] => 11213
            [version] => 1.1.12
        )

    [3] => Array
        (
            [host] => 10.62.240.9
            [port] => 11214
            [version] => 1.1.12
        )

)
 

【结束语】

最后提出两个使用Memcache的小技巧,第一个是如果是一个有效分布式存储的数据,key的取名是很有学问的,这个可以按照项目需要去做,但是key值不要太长,不会冲突就行。第二个就是每个保存在memcache中的数据不要超过1MB。第三个就是开启一个Memcache进程设置内存不要太多也不要太少,按照自己合适设置就行,尽量最大程度提高对硬件的使用,同样可以采取在一台服务器上开启多个memcached来分担一个memcached并发链接的压力。更多技巧在实际使用长慢慢去总结发现,会发现其实memcahe虽然简单,但是很好用。

本文总的就是发现一些简单的东西,可以通过自主扩展的方式来发现更多有趣实用的功能,我想,这就是开源产品的魅力所在吧。欢迎提出批评或者是更好的实现方式。

来自CSDN博客,转载请标明出处:http://blog.csdn.net/heiyeshuwu/archive/2007/06/26/1666411.aspx

========================
memcached全面剖析–4. memcached的分布式算法

memcached的分布式

正如第1次中介绍的那样, memcached虽然称为“分布式”缓存服务器,但服务器端并没有“分布式”功能。服务器端仅包括 第2次、 第3次 前坂介绍的内存存储功能,其实现非常简单。至于memcached的分布式,则是完全由客户端程序库实现的。这种分布式是memcached的最大特点。

memcached的分布式是什么意思?

这里多次使用了“分布式”这个词,但并未做详细解释。现在开始简单地介绍一下其原理,各个客户端的实现基本相同。

下面假设memcached服务器有node1~node3三台,应用程序要保存键名为“tokyo”“kanagawa”“chiba”“saitama”“gunma” 的数据。

memcached-0004-01.png

图1 分布式简介:准备

首先向memcached中添加“tokyo”。将“tokyo”传给客户端程序库后,客户端实现的算法就会根据“键”来决定保存数据的memcached服务器。服务器选定后,即命令它保存“tokyo”及其值。

memcached-0004-02.png

图2 分布式简介:添加时

同样,“kanagawa”“chiba”“saitama”“gunma”都是先选择服务器再保存。

接下来获取保存的数据。获取时也要将要获取的键“tokyo”传递给函数库。函数库通过与数据保存时相同的算法,根据“键”选择服务器。使用的算法相同,就能选中与保存时相同的服务器,然后发送get命令。只要数据没有因为某些原因被删除,就能获得保存的值。

memcached-0004-03.png

图3 分布式简介:获取时

这样,将不同的键保存到不同的服务器上,就实现了memcached的分布式。 memcached服务器增多后,键就会分散,即使一台memcached服务器发生故障无法连接,也不会影响其他的缓存,系统依然能继续运行。

接下来介绍第1次 中提到的Perl客户端函数库Cache::Memcached实现的分布式方法。

Cache::Memcached的分布式方法

Perl的memcached客户端函数库Cache::Memcached是 memcached的作者Brad Fitzpatrick的作品,可以说是原装的函数库了。

  • Cache::Memcached - search.cpan.org

该函数库实现了分布式功能,是memcached标准的分布式方法。

根据余数计算分散

Cache::Memcached的分布式方法简单来说,就是“根据服务器台数的余数进行分散”。求得键的整数哈希值,再除以服务器台数,根据其余数来选择服务器。

下面将Cache::Memcached简化成以下的Perl脚本来进行说明。

use strict;
use warnings;
use String::CRC32;

my @nodes = ('node1','node2','node3');
my @keys = ('tokyo', 'kanagawa', 'chiba', 'saitama', 'gunma');

foreach my $key (@keys) {
    my $crc = crc32($key);             # CRC値
    my $mod = $crc % ( $#nodes + 1 );
    my $server = $nodes[ $mod ];       # 根据余数选择服务器
    printf "%s => %s/n", $key, $server;
}

Cache::Memcached在求哈希值时使用了CRC。

  • String::CRC32 - search.cpan.org

首先求得字符串的CRC值,根据该值除以服务器节点数目得到的余数决定服务器。上面的代码执行后输入以下结果:

tokyo       => node2
kanagawa => node3
chiba       => node2
saitama   => node1
gunma     => node1

根据该结果,“tokyo”分散到node2,“kanagawa”分散到node3等。多说一句,当选择的服务器无法连接时,Cache::Memcached会将连接次数添加到键之后,再次计算哈希值并尝试连接。这个动作称为rehash。不希望rehash时可以在生成Cache::Memcached对象时指定“rehash => 0”选项。

根据余数计算分散的缺点

余数计算的方法简单,数据的分散性也相当优秀,但也有其缺点。那就是当添加或移除服务器时,缓存重组的代价相当巨大。添加服务器后,余数就会产生巨变,这样就无法获取与保存时相同的服务器,从而影响缓存的命中率。用Perl写段代码来验证其代价。

use strict;
use warnings;
use String::CRC32;

my @nodes = @ARGV;
my @keys = ('a'..'z');
my %nodes;

foreach my $key ( @keys ) {
    my $hash = crc32($key);
    my $mod = $hash % ( $#nodes + 1 );
    my $server = $nodes[ $mod ];
    push @{ $nodes{ $server } }, $key;
}

foreach my $node ( sort keys %nodes ) {
    printf "%s: %s/n", $node,  join ",", @{ $nodes{$node} };
}

这段Perl脚本演示了将“a”到“z”的键保存到memcached并访问的情况。将其保存为mod.pl并执行。

首先,当服务器只有三台时:

$ mod.pl node1 node2 nod3
node1: a,c,d,e,h,j,n,u,w,x
node2: g,i,k,l,p,r,s,y
node3: b,f,m,o,q,t,v,z

结果如上,node1保存a、c、d、e……,node2保存g、i、k……,每台服务器都保存了8个到10个数据。

接下来增加一台memcached服务器。

$ mod.pl node1 node2 node3 node4
node1: d,f,m,o,t,v
node2: b,i,k,p,r,y
node3: e,g,l,n,u,w
node4: a,c,h,j,q,s,x,z

添加了node4。可见,只有d、i、k、p、r、y命中了。像这样,添加节点后键分散到的服务器会发生巨大变化。26个键中只有六个在访问原来的服务器,其他的全都移到了其他服务器。命中率降低到23%。在Web应用程序中使用memcached时,在添加memcached服务器的瞬间缓存效率会大幅度下降,负载会集中到数据库服务器上,有可能会发生无法提供正常服务的情况。

mixi的Web应用程序运用中也有这个问题,导致无法添加memcached服务器。但由于使用了新的分布式方法,现在可以轻而易举地添加memcached服务器了。这种分布式方法称为 Consistent Hashing。

Consistent Hashing

关于Consistent Hashing的思想,mixi株式会社的开发blog等许多地方都介绍过,这里只简单地说明一下。

  • mixi Engineers' Blog - スマートな分散で快適キャッシュライフ
  • ConsistentHashing - コンシステント ハッシュ法

Consistent Hashing的简单说明

Consistent Hashing如下所示:首先求出memcached服务器(节点)的哈希值,并将其配置到0~232的圆(continuum)上。然后用同样的方法求出存储数据的键的哈希值,并映射到圆上。然后从数据映射到的位置开始顺时针查找,将数据保存到找到的第一个服务器上。如果超过232仍然找不到服务器,就会保存到第一台memcached服务器上。

memcached-0004-04.png

图4 Consistent Hashing:基本原理

从上图的状态中添加一台memcached服务器。余数分布式算法由于保存键的服务器会发生巨大变化而影响缓存的命中率,但Consistent Hashing中,只有在continuum上增加服务器的地点逆时针方向的第一台服务器上的键会受到影响。

memcached-0004-05.png

图5 Consistent Hashing:添加服务器

因此,Consistent Hashing最大限度地抑制了键的重新分布。而且,有的Consistent Hashing的实现方法还采用了虚拟节点的思想。使用一般的hash函数的话,服务器的映射地点的分布非常不均匀。因此,使用虚拟节点的思想,为每个物理节点(服务器)在continuum上分配100~200个点。这样就能抑制分布不均匀,最大限度地减小服务器增减时的缓存重新分布。

通过下文中介绍的使用Consistent Hashing算法的memcached客户端函数库进行测试的结果是,由服务器台数(n)和增加的服务器台数(m)计算增加服务器后的命中率计算公式如下:

(1 - n/(n+m)) * 100

支持Consistent Hashing的函数库

本连载中多次介绍的Cache::Memcached虽然不支持Consistent Hashing,但已有几个客户端函数库支持了这种新的分布式算法。第一个支持Consistent Hashing和虚拟节点的memcached客户端函数库是名为libketama的PHP库,由last.fm开发。

  • libketama - a consistent hashing algo for memcache clients – RJ ブログ - Users at Last.fm

至于Perl客户端,连载的第1次 中介绍过的Cache::Memcached::Fast和Cache::Memcached::libmemcached支持 Consistent Hashing。

  • Cache::Memcached::Fast - search.cpan.org
  • Cache::Memcached::libmemcached - search.cpan.org

两者的接口都与Cache::Memcached几乎相同,如果正在使用Cache::Memcached,那么就可以方便地替换过来。Cache::Memcached::Fast重新实现了libketama,使用Consistent Hashing创建对象时可以指定ketama_points选项。

my $memcached = Cache::Memcached::Fast->new({
    servers => ["192.168.0.1:11211","192.168.0.2:11211"],
    ketama_points => 150
});

另外,Cache::Memcached::libmemcached 是一个使用了Brain Aker开发的C函数库libmemcached的Perl模块。 libmemcached本身支持几种分布式算法,也支持Consistent Hashing,其Perl绑定也支持Consistent Hashing。

  • Tangent Software: libmemcached

总结

本次介绍了memcached的分布式算法,主要有memcached的分布式是由客户端函数库实现,以及高效率地分散数据的Consistent Hashing算法。下次将介绍mixi在memcached应用方面的一些经验,和相关的兼容应用程序。

================================================
memcached全面剖析–5. memcached的应用和兼容程序

mixi案例研究

mixi在提供服务的初期阶段就使用了memcached。随着网站访问量的急剧增加,单纯为数据库添加slave已无法满足需要,因此引入了memcached。此外,我们也从增加可扩展性的方面进行了验证,证明了memcached的速度和稳定性都能满足需要。现在,memcached已成为mixi服务中非常重要的组成部分。

memcached-0005-01.png

图1 现在的系统组件

服务器配置和数量

mixi使用了许许多多服务器,如数据库服务器、应用服务器、图片服务器、反向代理服务器等。单单memcached就有将近200台服务器在运行。 memcached服务器的典型配置如下:

  • CPU:Intel Pentium 4 2.8GHz
  • 内存:4GB
  • 硬盘:146GB SCSI
  • 操作系统:Linux(x86_64)

这些服务器以前曾用于数据库服务器等。随着CPU性能提升、内存价格下降,我们积极地将数据库服务器、应用服务器等换成了性能更强大、内存更多的服务器。这样,可以抑制mixi整体使用的服务器数量的急剧增加,降低管理成本。由于memcached服务器几乎不占用CPU,就将换下来的服务器用作memcached服务器了。

memcached进程

每台memcached服务器仅启动一个memcached进程。分配给memcached的内存为3GB,启动参数如下:

/usr/bin/memcached -p 11211 -u nobody -m 3000 -c 30720

由于使用了x86_64的操作系统,因此能分配2GB以上的内存。32位操作系统中,每个进程最多只能使用2GB内存。也曾经考虑过启动多个分配2GB以下内存的进程,但这样一台服务器上的TCP连接数就会成倍增加,管理上也变得复杂,所以mixi就统一使用了64位操作系统。

另外,虽然服务器的内存为4GB,却仅分配了3GB,是因为内存分配量超过这个值,就有可能导致内存交换(swap)。连载的第2次中前坂讲解过了memcached的内存存储“slab allocator”,当时说过,memcached启动时指定的内存分配量是memcached用于保存数据的量,没有包括“slab allocator”本身占用的内存、以及为了保存数据而设置的管理空间。因此,memcached进程的实际内存分配量要比指定的容量要大,这一点应当注意。

mixi保存在memcached中的数据大部分都比较小。这样,进程的大小要比指定的容量大很多。因此,我们反复改变内存分配量进行验证,确认了3GB的大小不会引发swap,这就是现在应用的数值。

memcached使用方法和客户端

现在,mixi的服务将200台左右的memcached服务器作为一个pool使用。每台服务器的容量为3GB,那么全体就有了将近600GB的巨大的内存数据库。客户端程序库使用了本连载中多次提到车的Cache::Memcached::Fast,与服务器进行交互。当然,缓存的分布式算法使用的是 第4次介绍过的 Consistent Hashing算法。

  • Cache::Memcached::Fast - search.cpan.org

应用层上memcached的使用方法由开发应用程序的工程师自行决定并实现。但是,为了防止车轮再造、防止Cache::Memcached::Fast上的教训再次发生,我们提供了Cache::Memcached::Fast的wrap模块并使用。

通过Cache::Memcached::Fast维持连接

Cache::Memcached的情况下,与memcached的连接(文件句柄)保存在Cache::Memcached包内的类变量中。在mod_perl和FastCGI等环境下,包内的变量不会像CGI那样随时重新启动,而是在进程中一直保持。其结果就是不会断开与memcached的连接,减少了TCP连接建立时的开销,同时也能防止短时间内反复进行TCP连接、断开而导致的TCP端口资源枯竭。

但是,Cache::Memcached::Fast没有这个功能,所以需要在模块之外将Cache::Memcached::Fast对象保持在类变量中,以保证持久连接。

package Gihyo::Memcached;

use strict;
use warnings;
use Cache::Memcached::Fast;

my @server_list = qw/192.168.1.1:11211 192.168.1.1:11211/;
my $fast;  ## 用于保持对象

sub new {
    my $self  = bless {}, shift;
    if ( !$fast ) {
        $fast = Cache::Memcached::Fast->new({ servers => /@server_list });
    }
    $self->{_fast} = $fast;
    return $self;
}

sub get {
   my $self = shift;
   $self->{_fast}->get(@_);
}

上面的例子中,Cache::Memcached::Fast对象保存到类变量$fast中。

公共数据的处理和rehash

诸如mixi的主页上的新闻这样的所有用户共享的缓存数据、设置信息等数据,会占用许多页,访问次数也非常多。在这种条件下,访问很容易集中到某台memcached服务器上。访问集中本身并不是问题,但是一旦访问集中的那台服务器发生故障导致memcached无法连接,就会产生巨大的问题。

连载的第4次 中提到,Cache::Memcached拥有rehash功能,即在无法连接保存数据的服务器的情况下,会再次计算hash值,连接其他的服务器。

但是,Cache::Memcached::Fast没有这个功能。不过,它能够在连接服务器失败时,短时间内不再连接该服务器的功能。

my $fast = Cache::Memcached::Fast->new({
    max_failures     => 3,
    failure_timeout  => 1
});

在failure_timeout秒内发生max_failures以上次连接失败,就不再连接该memcached服务器。我们的设置是1秒钟3次以上。

此外,mixi还为所有用户共享的缓存数据的键名设置命名规则,符合命名规则的数据会自动保存到多台memcached服务器中,取得时从中仅选取一台服务器。创建该函数库后,就可以使memcached服务器故障不再产生其他影响。

memcached应用经验

到此为止介绍了memcached内部构造和函数库,接下来介绍一些其他的应用经验。

通过daemontools启动

通常情况下memcached运行得相当稳定,但mixi现在使用的最新版1.2.5 曾经发生过几次memcached进程死掉的情况。架构上保证了即使有几台memcached故障也不会影响服务,不过对于memcached进程死掉的服务器,只要重新启动memcached,就可以正常运行,所以采用了监视memcached进程并自动启动的方法。于是使用了daemontools。

daemontools是qmail的作者DJB开发的UNIX服务管理工具集,其中名为supervise的程序可用于服务启动、停止的服务重启等。

  • daemontools

这里不介绍daemontools的安装了。mixi使用了以下的run脚本来启动memcached。

#!/bin/sh

if [ -f /etc/sysconfig/memcached ];then
        . /etc/sysconfig/memcached
fi

exec 2>&1
exec /usr/bin/memcached -p $PORT -u $USER  -m $CACHESIZE -c $MAXCONN $OPTIONS

监视

mixi使用了名为“nagios”的开源监视软件来监视memcached。

  • Nagios: Home

在nagios中可以简单地开发插件,可以详细地监视memcached的get、add等动作。不过mixi仅通过stats命令来确认memcached的运行状态。

define command {
command_name                   check_memcached
command_line                   $USER1$/check_tcp -H $HOSTADDRESS$ -p 11211 -t 5 -E -s 'stats/r/nquit/r/n' -e 'uptime' -M crit
}

此外,mixi将stats目录的结果通过rrdtool转化成图形,进行性能监视,并将每天的内存使用量做成报表,通过邮件与开发者共享。

memcached的性能

连载中已介绍过,memcached的性能十分优秀。我们来看看mixi的实际案例。这里介绍的图表是服务所使用的访问最为集中的memcached服务器。

memcached-0005-02.png

图2 请求数

memcached-0005-03.png

图3 流量

memcached-0005-04.png

图4 TCP连接数

从上至下依次为请求数、流量和TCP连接数。请求数最大为15000qps,流量达到400Mbps,这时的连接数已超过了10000个。该服务器没有特别的硬件,就是开头介绍的普通的memcached服务器。此时的CPU利用率为:

memcached-0005-05.png

图5 CPU利用率可见,仍然有idle的部分。因此,memcached的性能非常高,可以作为Web应用程序开发者放心地保存临时数据或缓存数据的地方。

兼容应用程序

memcached的实现和协议都十分简单,因此有很多与memcached兼容的实现。一些功能强大的扩展可以将memcached的内存数据写到磁盘上,实现数据的持久性和冗余。连载第3次 介绍过,以后的memcached的存储层将变成可扩展的(pluggable),逐渐支持这些功能。这里介绍几个与memcached兼容的应用程序。

repcached
为memcached提供复制(replication)功能的patch。
Flared
存储到QDBM。同时实现了异步复制和fail over等功能。
memcachedb
存储到BerkleyDB。还实现了message queue。
Tokyo Tyrant
将数据存储到Tokyo Cabinet。不仅与memcached协议兼容,还能通过HTTP进行访问。

Tokyo Tyrant案例

mixi使用了上述兼容应用程序中的Tokyo Tyrant。Tokyo Tyrant是平林开发的 Tokyo Cabinet DBM的网络接口。它有自己的协议,但也拥有memcached兼容协议,也可以通过HTTP进行数据交换。Tokyo Cabinet虽然是一种将数据写到磁盘的实现,但速度相当快。mixi并没有将Tokyo Tyrant作为缓存服务器,而是将它作为保存键值对组合的DBMS来使用。主要作为存储用户上次访问时间的数据库来使用。它与几乎所有的mixi服务都有关,每次用户访问页面时都要更新数据,因此负荷相当高。MySQL的处理十分笨重,单独使用memcached保存数据又有可能会丢失数据,所以引入了Tokyo Tyrant。但无需重新开发客户端,只需原封不动地使用Cache::Memcached::Fast即可,这也是优点之一。关于Tokyo Tyrant的详细信息,请参考本公司的开发blog。

  • mixi Engineers' Blog - Tokyo Tyrantによる耐高負荷DBの構築
  • mixi Engineers' Blog - Tokyo (Cabinet|Tyrant)の新機能
  • 总结

    到本次为止,“memcached全面剖析”系列就结束了。我们介绍了memcached的基础、内部结构、分散算法和应用等内容。读完后如果您能对memcached产生兴趣,就是我们的荣幸。关于mixi的系统、应用方面的信息,请参考本公司的开发blog。感谢您

  • 0
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值