这是之前参加的一个互联网架构培训的笔记,整理出来,方便使用。
大型互联网站的7种武器
一、Cache
分为本地 cache ( OsCache )与远程cache ( Memcached )。
1.本地cache ( OsCache )
缓存任何对象:可以不受限制的缓存部分jsp页面或HTTP请求,任何java对象都可以缓存。
拥有全面的API:OSCache API允许你通过编程的方式来控制所有的OSCache 特性。
永久缓存:缓存能被配置写入硬盘,因此允许在应用服务器的多次生命周期间缓存创建开销昂贵的数据。
支持集群:集群缓存数据能被单个的进行参数配置,不需要修改代码。
缓存过期:你可以有最大限度的控制缓存对象的过期,包括可插入式的刷新策略(如果默认性能不能满足需要时)
OsCache组件模型
OsCache页面片段缓存
要缓存一个从数据源的 A 表取数据的 JSP 内容段
<oscache:cache key="foobar"scope="application" time="-1"groups="group1" >
//business code
Select * from table A and Display
</oscache:cache>
数据源更新了,在处理数据更新事件的代码中,加入代码:
OSCacheUtil.getInstance().flushGroup("group1");
2.远程cache( Memcached )
特点
协议简单
基于libevent的事件处理
内置内存存储方式
memcached不互相通信的分布式特点
Memcached访问模型
Memcached协议
通讯:memcached 的客户端使用TCP 链接与服务器通讯。( UDP接口也同样有效)
Key:存储在memcached中的数据通过键值来标识。客户端与服务器端都必须是唯一的。
命令:存储命令(set、add、repalce)指示服务器储存一些由键值标识的数据。取回命令(只有一项:‘get’)指示服务器返回与所给键值相符合的数据。
时间参数:一些客户端发送给服务器的命令会包含一些时限(针对内容或客户端请求的操作)。
Memcached内存管理
memcached中保存的数据都存储在memcached内置的内存存储空间中。重启memcached、重启操作系统会导致全部数据消失。
内容容量不足时,就基于LRU(LeastRecently Used)算法自动删除部分内存。
memcache采用Slab Allocation的内存管理方式:将分配的内存分割成各种尺寸的块(chunk ),并把尺寸相同的块分成组(chunk的集合)。
memcached的分布式
Memcached分布算法-余数 Hash
根据服务器台数的余数进行分散,求得键的整数哈希值,再除以服务器台数,根据其余数来选择服务器。
当选择的服务器无法连接时,将连接次数添加到键之后,再次计算哈希值并尝试连接。这个动作称为rehash。
当添加或移除服务器时,余数就会产生巨变,这样就无法获取与保存时相同的服务器,从而影响缓存的命中率。
Memcached分布算法-Consistent Hashing
首先求出memcached服务器(节点)的哈希值,并将其配置到0~232的圆(continuum)上。然后用同样的方法求出存储数据的键的哈希值,并映射到圆上。然后从数据映射到的位置开始顺时针查找,将数据保存到找到的第一个服务器。