应用服务性能优化-缓存

最新推荐文章于 2023-01-07 19:58:19 发布

四猿外

最新推荐文章于 2023-01-07 19:58:19 发布

阅读量180

点赞数

文章标签：缓存 memcached 数据库

本文链接：https://blog.csdn.net/siyuanwai/article/details/119868539

版权

缓存

网站性能优化第一定律：优先考虑使用缓存优化性能
Mark 老师的推论：缓存离用户越近越好

1 缓存的基本原理和本质

缓存是将数据存在访问速度较高的介质中。可以减少数据访问的时间，同时避免重复计算。

2 合理使用缓冲的准则

频繁修改的数据，尽量不要缓存，读写比2:1 以上才有缓存的价值。
缓存一定是热点数据。
应用需要容忍一定时间的数据不一致。
缓存可用性问题，一般通过热备或者集群来解决。
缓存预热，新启动的缓存系统没有任何数据，可以考虑将一些热点数据提前加载到缓存系统。
解决缓存击穿：
1、布隆过滤器，或者2、把不存在的数据也缓存起来，比如有请求总是访问key = 23 的
数据，但是这个key = 23 的数据在系统中不存在，可以考虑在缓存中构建一个( key=23 value
= null)的数据。

3 分布式缓存与一致性哈希

以集群的方式提供缓存服务，有两种实现；

1、需要更新同步的分布式缓存，所有的服务器保存相同的缓存数据，带来的问题就是，缓存的数据量受限制，其次，数据要在所有的机器上同步，代价很大。

2、每台机器只缓存一部分数据，然后通过一定的算法选择缓存服务器。常见的余数hash算法存在当有服务器上下线的时候，大量缓存数据重建的问题。所以提出了一致性哈希算法。

一致性哈希：

首先求出服务器（节点）的哈希值，并将其配置到0～232 的圆（continuum）上。
然后采用同样的方法求出存储数据的键的哈希值，并映射到相同的圆上。
然后从数据映射到的位置开始顺时针查找，将数据保存到找到的第一个服务器上。如果超过232 仍然找不到服务器，就会保存到第一台服务器上。

一致性哈希算法对于节点的增减都只需重定位环空间中的一小部分数据，具有较好的容错性和可扩展性。

一致性哈希算法在服务节点太少时，容易因为节点分部不均匀而造成数据倾斜问题，此时必然造成大量数据集中到Node A 上，而只有极少量会定位到Node B 上。为了解决这种数据倾斜问题，一致性哈希算法引入了虚拟节点机制，即对每一个服务节点计算多个哈希，每个计算结果位置都放置一个此服务节点，称为虚拟节点。具体做法可以在服务器ip 或主机名的后面增加编号来实现。例如，可以为每台服务器计算三个虚拟节点，于是可以分别计算“Node A#1”、“Node A#2”、“Node A#3”、“Node B#1”、“Node B#2”、“Node B#3”的哈希值，于是形成六个虚拟节点：同时数据定位算法不变，只是多了一步虚拟节点到实际节点的映射，例如定位到“Node A#1”、“Node A#2”、“Node A#3”三个虚拟节点的数据均定位到Node A上。这样就解决了服务节点少时数据倾斜的问题。在实际应用中，通常将虚拟节点数设置为32 甚至更大，因此即使很少的服务节点也能做到相对均匀的数据分布。