深入讲解 Memcached

最新推荐文章于 2024-07-18 20:52:11 发布

杨哥带你写代码

最新推荐文章于 2024-07-18 20:52:11 发布

阅读量1.3k

点赞数 37

文章标签： memcached 数据库缓存

本文链接：https://blog.csdn.net/2401_85339615/article/details/139757758

版权

深入讲解 Memcached

Memcached 的数据存储机制

Memcached 采用了 key-value 存储模型，所有数据以键值对的形式存储在内存中。数据存储过程如下：

键值对的存储

键：键是唯一标识数据的字符串，最大长度为 250 字节。键的唯一性保证了在存储数据时不会发生冲突。
值：值是数据本身，最大长度为 1 MB。Memcached 对存储的数据没有类型限制，可以是任何二进制数据。

内存分配

Memcached 使用 slab 分配器将内存划分为不同大小的块（chunk），每个 slab 由大小相同的 chunk 组成。具体步骤如下：

内存预分配：启动时，Memcached 将可用内存划分为多个 slab 类别（class），每个类别包含多个大小相同的 chunk。
按需分配：当有新的数据需要存储时，Memcached 会根据数据大小选择合适的 slab 类别进行分配。

LRU 算法

Memcached 采用 LRU（Least Recently Used）算法管理内存：

最近最少使用：当内存不足时，Memcached 会移除最久未使用的数据，以腾出空间存储新数据。
LRU 队列：每个 slab 类别都有一个 LRU 队列，记录该类别内所有 chunk 的使用顺序。

Memcached 的一致性哈希

在分布式环境中，Memcached 使用一致性哈希算法来分配数据到不同的服务器节点。其过程如下：

哈希环

节点映射：所有服务器节点按哈希值排列成一个环，每个节点负责一个范围的哈希值。
虚拟节点：为了提高分布的均匀性和减少数据迁移，通常会为每个物理节点分配多个虚拟节点。

数据映射

哈希计算：数据键通过哈希函数（如 MD5、CRC32）映射到一个哈希值。
节点分配：将哈希值映射到哈希环上的一个位置，并存储在该位置对应的节点上。

节点变动

新增节点：新增节点会占据哈希环上的一部分范围，原本属于该范围的数据会迁移到新节点。
删除节点：删除节点负责的范围会重新分配给其他节点，数据迁移量较小。

Memcached 的内存管理

Memcached 使用 slab 分配器进行内存管理，其机制如下：

Slab 类别

类别划分：Memcached 将内存按大小划分为多个 slab 类别，每个类别包含多个大小相同的 chunk。
类别增长：从小到大，每个类别的 chunk 大小逐步增加，常见的增长因子为 1.25 倍。

分配策略

选择类别：根据数据大小选择合适的 slab 类别分配 chunk。
分配失败：如果某个类别的 chunk 用完且没有空闲空间，会分配新的 slab 给该类别。

垃圾回收

LRU 算法：定期清理每个 slab 类别内最久未使用的数据。
空闲管理：未使用的 chunk 会被标记为空闲，以便后续使用。

Memcached 的集群架构

Memcached 没有内置的集群管理功能，但可以通过客户端实现分布式缓存。常用的集群架构包括：

客户端分片

一致性哈希：客户端使用一致性哈希算法将数据分片存储到不同的 Memcached 实例上。
分片配置：客户端需要维护 Memcached 实例的列表，并动态调整分片策略。

代理层

中间层：在客户端和 Memcached 服务器之间添加代理层，负责请求的路由和数据分片管理。
代理软件：常见的代理软件包括 Twemproxy、mcrouter 等，它们可以自动处理节点变动和数据分片。

Memcached 与 Redis 对比

Memcached 和 Redis 都是常用的缓存解决方案，但它们在功能和应用场景上有所不同。

特性	Memcached	Redis
数据类型	仅支持字符串	支持字符串、哈希、列表、集合等多种数据类型
持久化	不支持数据持久化	支持数据持久化，提供 RDB 和 AOF 两种持久化方式
集群支持	无内置集群管理功能	原生支持 Redis Cluster 集群模式
内存管理	基于 slab 分配器，采用 LRU 算法	可配置多种内存淘汰策略，包括 LRU、LFU 等
性能	读写性能高，适合纯缓存场景	性能稍低，但功能丰富，适合多种应用场景

高级使用技巧

批量操作：使用 get_multi 和 set_multi 方法进行批量读取和写入，提高性能。

import pylibmc
client = pylibmc.Client(["127.0.0.1"], binary=True)
# 批量写入
client.set_multi({"key1": "value1", "key2": "value2", "key3": "value3"})
# 批量读取
values = client.get_multi(["key1", "key2", "key3"])
print(values)

异步操作：结合异步库（如 twisted）实现非阻塞的 Memcached 操作。

from twisted.internet import reactor, defer
from txmemcache.client import MemCacheClientFactory

@defer.inlineCallbacks
def example():
    client = yield MemCacheClientFactory.get_client('127.0.0.1', 11211)
    yield client.set('key', 'value')
    value = yield client.get('key')
    print(value)
    reactor.stop()

reactor.callWhenRunning(example)
reactor.run()

压缩数据：对大数据进行压缩存储，节省内存，提高传输效率。

import pylibmc
import zlib
client = pylibmc.Client(["127.0.0.1"], binary=True)
# 压缩并存储数据
compressed_value = zlib.compress(b"some large data")
client.set("key", compressed_value)
# 解压缩并读取数据
compressed_value = client.get("key")
value = zlib.decompress(compressed_value)
print(value)

性能优化

合理设置过期时间：根据数据访问频率和重要性，设置合适的过期时间，避免频繁缓存失效。
```
client.set("key", "value", time=60)  # 设置 60 秒的过期时间
```
优化网络配置：使用高性能网络设备和协议（如 TCP_NODELAY）减少延迟。
```
client = pylibmc.Client(["127.0.0.1"], binary=True, behaviors={"tcp_nodelay": True})
```
监控和调优：定期监控 Memcached 的运行状态，调整内存分配策略和缓存策略。
- 使用 memcached-tool 检查缓存使用情况：
```
memcached-tool 127.0.0.1:11211 stats
```

通过深入了解和合理使用 Memcached，可以大幅提高 Web 应用的性能和响应速度。Memcached 是一个强大的工具，但需要根据具体应用场景进行优化和调整，以充分发挥其优势。

杨哥带你写代码

关注

37
点赞
踩
24

收藏

觉得还不错? 一键收藏
0
评论
深入讲解 Memcached

通过深入了解和合理使用 Memcached，可以大幅提高 Web 应用的性能和响应速度。Memcached 是一个强大的工具，但需要根据具体应用场景进行优化和调整，以充分发挥其优势。Memcached 使用 slab 分配器将内存划分为不同大小的块（chunk），每个 slab 由大小相同的 chunk 组成。Memcached 和 Redis 都是常用的缓存解决方案，但它们在功能和应用场景上有所不同。：定期监控 Memcached 的运行状态，调整内存分配策略和缓存策略。
复制链接

扫一扫