缓存击穿
缓存穿透指的是在缓存中找不到数据,而且这个数据在数据源中也不存在,导致每次查询都需要去数据库中查询,从而对数据库造成了极大的压力。缓存穿透通常是由于黑客攻击、恶意访问或者缓存未命中时导致的。
相信很多人写代码都是下面这个逻辑,拿数据的时候,先去缓存拿,缓存拿不到就去数据库里读,读取到了设置缓存然后返回,读取不到就直接抛出错误,下面最致命的问题就是如果别人一直丢给你一个不存在的ID,大量的请求是可以直接到你的DB的,你的数据库一直在查询一个不存在的记录,假设我绕过了你的验证可以直接请求你的数据,ab开10w个请求同时请求你接口,瞬间你数据库qps就上去了,很可能就把你DB给打挂了。
错误示范:
<?php
function getData($id) {
$cacheKey = 'data_' . $id;
$data = redis_get($cacheKey);
if ($data === null) {
// 如果缓存中没有数据,则从数据库获取
$data = getFromDatabase($id);
if ($data) {
redis_set($cacheKey, $data);
return $data;
}
error_response("找不到数据")
}
$id = $_GET['id'];
$data = getData($id);
正确示范:哪怕查询不到数据,也给空数据塞一个空值,过期时间根据业务定义,这种情况无论你大量请求都落到了缓存上,缓存能承载的QPS就高了,所以简单场景下可以防止这种问题
<?php
function getData($id) {
$cacheKey = 'data_' . $id;
$data = redis_get($cacheKey);
if ($data === null) {
// 如果缓存中没有数据,则从数据库获取
$data = getFromDatabase($id);
if ($data === null) {
// 如果数据库中也没有数据,则缓存空对象并设置过期时间
redis_set($cacheKey, 'null', 60);
} else {
// 如果数据库中有数据,则写入缓存并返回
redis_set($cacheKey, json_encode($data), 60);
}
} else if ($data === 'null') {
// 如果缓存中有空对象,则返回空数组
return [];
} else {
// 如果缓存中有数据,则返回解码后的数据
return json_decode($data, true);
}
}
$id = $_GET['id'];
$data = getData($id);
缓存穿透
缓存击穿指的是缓存中的key过期或者被删除,导致大量请求直接打在数据库上,造成了瞬时流量的剧增,从而对数据库造成了极大的压力。缓存击穿通常是由于缓存中的数据过期时间设置不合理、并发量大等原因导致的。
<?php
function get_user_info($user_id) {
$cache_key = 'user_info_' . $user_id;
$cache_expire = 60; // 缓存时间 60 秒
$user_info = get_cache($cache_key); // 从缓存获取用户信息
if (!$user_info) {
$user_info = get_user_info_from_db($user_id); // 从数据库获取用户信息
if ($user_info) {
set_cache($cache_key, $user_info, $cache_expire); // 将用户信息写入缓存
} else {
// 数据库中不存在该用户信息,抛出异常
throw new Exception('User not found');
}
}
return $user_info;
}
?>
在上面的代码中,我们尝试从缓存中获取用户信息,如果获取不到,则从数据库中获取,并将其写入缓存。但是,如果有大量的请求同时获取同一个缓存数据,当该数据过期或者被清空后,这些请求将会涌入到数据库中,导致存储系统压力骤增,甚至瘫痪。
为了避免缓存击穿问题,我们可以采用以下两种方案之一:
针对每个热点数据设置不同的过期时间。这样可以避免所有缓存同时过期,从而减少大量请求涌入存储系统的情况。
使用分布式锁。在某个热点数据的缓存过期后,只允许一个线程去数据库中加载数据,并将其写入缓存,其他线程等待该线程执行完毕后再从缓存获取数据。这样可以避免大量请求同时涌入存储系统的情况。