缓存技术~

最新推荐文章于 2024-06-15 18:01:14 发布

_long_ago

最新推荐文章于 2024-06-15 18:01:14 发布

阅读量2.2k

点赞数

本文链接：https://blog.csdn.net/qq_40303781/article/details/90727159

版权

平常使用的关系型数据库有Mysql、Oracle以及SqlServer等，在开发的过程中，数据通常都是通过Web提供的数据库驱动来链接数据库进行增删改查。

那么，日常使用的数据库的数据都储存在哪里呢？以Mysql为例。打开Mysql所在的文件夹目录下的data文件夹可以发现，里面都是创建的数据库，打开其中一个，可以看到创建的表，他们以文件(格式frm和ibd)的形式存在。

也就是说，日常使用的关系型数据中的数据，全部存储在部署数据库的机器的硬盘中。

一般我们的网站开发完成，上线之后，服务器的读写效率是网站运行速度的重要条件，当然还有服务器的带宽等，但是这些东西都可以通过硬件的更新升级来解决。其实与网站运行效率息息相关的东西，就是------数据库。

数据库处理数据的速度，与网站速度息息相关，而数据查询、数据处理等等，都和数据库处理速度有关。提高数据库的处理数据的能力，其中一个方案就是sql语句的优化技术，sql语句写的处理效率比较高，数据库处理能力就会上去，而网站的数据处理能力也会快些。

但是，当网站的处理和访问量非常大的时候，数据库的压力就变大了，数据库的连接池，数据库同时处理数据的能力就会受到很大的挑战，一旦数据库承受了其最大承受能力，网站的数据处理效率就会大打折扣。此时就要使用高并发处理、负载均衡和分布式数据库，而这些技术既花费人力，又花费资金。据统计，mysql的连接池并发数max为 500-1000，这时就可以使用redis缓存来帮助数据库缓解压力

缓存

缓存就是在内存中存储的数据备份，当数据没有发生本质改变的时候，就不让数据的查询去数据库进行操作，而去内存中取数据，这样就大大降低了数据库的读写次数，而且从内存中读数据的速度比去数据库查询要快一些，这样同时又提高了效率。

使用缓存减轻数据库的负载:

在开发网站的时候如果有一些数据在短时间之内不会发生变化，而它们还要被频繁访问，为了提高用户的请求速度和降低网站的负载，就把这些数据放到一个读取速度更快的介质上(或者是通过较少的计算量就可以获得该数据)，该行为就称作对该数据的缓存。该介质可以是文件/数据库/内存。内存经常用于数据库缓存。

缓存的两种形式：

页面缓存经常用在CMS(content manage system)内存管理系统里面。
数据缓存经常会用在页面的具体数据里面。

缓存分为两种:

页面缓存(smarty静态化技术)===》页面缓存，第一次从数据库读取，然后生成一个静态页面，以后所有的读取只需要加载这个页面就可以了，这就是页面缓存。

数据缓存

Redis介绍缓存技术

Redis是Remote Dictionary Server(远程数据服务)的缩写，该软件使用C语言编写，它的数据模型为key-value。它支持丰富的数据结构(类型)，比如String/List/Hash/Set/Sorted Set。

Redis特点：
1、Redis支持数据的持久化，可以将内存中的数据保存在磁盘中，重启的时候可以再次加载进行使用。

通过两种方式可以实现数据持久化：使用RDB快照的方式，将内存中的数据不断写入磁盘；或使用类似MySQL的AOF日志方式，记录每次更新的日志。前者性能较高，但是可能会引起一定程度的数据丢失；后者相反。

2、Redis不仅仅支持简单的key-value类型的数据，同时还提供String，list，set，zset，hash等数据结构的存储。

3、Redis支持数据的备份，即master-slave模式的数据备份。

4、性能极高 – Redis能读的速度是110000次/s,写的速度是81000次/s 。

5、原子 – Redis的所有操作都是原子性的，同时Redis还支持对几个操作全并后的原子性执行。丰富的特性 – Redis还支持 publish/subscribe, 通知, 设置key有效期等等特性。

MemCache的工作流程如下：先检查客户端的请求数据是否在memcached中，如有，直接把请求数据返回，不再对数据库进行任何操作；如果请求的数据不在memcached中，就去查数据库，把从数据库中获取的数据返回给客户端，同时把数据缓存一份到memcached中（memcached客户端不负责，需要程序明确实现）；每次更新数据库的同时更新memcached中的数据，保证一致性；当分配给memcached内存空间用完之后，会使用LRU（Least Recently Used，最近最少使用）策略加上到期失效策略，失效数据首先被替换，然后再替换掉最近未使用的数据。

redis和memcache比较

Memcached：一款完全开源、高性能的、分布式的内存系统；

Redis：一个开源的、Key-Value型、基于内存运行并支持持久化的NoSQL数据库；

1.Memcached追求的高性能的内存服务；而Redis追求的不仅仅是内存运行，还有数据持久化的需求

2.Redis不仅仅支持简单的k/v类型的数据，同时还提供list，set，zset，hash等数据结构的存储。

3.Redis支持master-slave(主-从)模式应用。

4.Redis支持数据持久化，可以将内存中的数据保持在磁盘中，重启的时候可以再次加载进行使用

5.Redis单个value的最大限制是1GB，memcached只能保存1MB的数据。

适用场景：

Memcached：动态系统中减轻数据库负载，提升性能；做缓存，适合多读少写，大数据量的情况（如人人网大量查询用户信息、好友信息、文章信息等）。

Redis：适用于对读写效率要求都很高，数据处理业务复杂和对安全性要求较高的系统（如新浪微博的计数和微博发布部分系统，对数据安全性、读写要求都很高）。

问题1：

比如你的redis只能存5G数据，可是你写了10G，那会删5G的数据。怎么删的，这个问题思考过么？还有，你的数据已经设置了过期时间，但是时间到了，内存占用率还是比较高，有思考过原因么?
回答:
redis采用的是定期删除+惰性删除策略。
为什么不用定时删除策略?
定时删除,用一个定时器来负责监视key,过期则自动删除。虽然内存及时释放，但是十分消耗CPU资源。在大并发请求下，CPU要将时间应用在处理请求，而不是删除key,因此没有采用这一策略.
定期删除+惰性删除是如何工作的呢?
定期删除，redis默认每个100ms检查，是否有过期的key,有过期key则删除。需要说明的是，redis不是每个100ms将所有的key检查一次，而是随机抽取进行检查(如果每隔100ms,全部key进行检查，redis岂不是卡死)。因此，如果只采用定期删除策略，会导致很多key到时间没有删除。
于是，惰性删除派上用场。也就是说在你获取某个key的时候，redis会检查一下，这个key如果设置了过期时间那么是否过期了？如果过期了此时就会删除。
采用定期删除+惰性删除就没其他问题了么?
不是的，如果定期删除没删除key。然后你也没即时去请求key，也就是说惰性删除也没生效。这样，redis的内存会越来越高。那么就应该采用内存淘汰机制。
在redis.conf中有一行配置# maxmemory-policy allkeys-lru，该配置就是配内存淘汰策略的。

问题2：

如果对数据有强一致性要求，不能放缓存。我们所做的一切，只能保证最终一致性。另外，我们所做的方案其实从根本上来说，只能说降低不一致发生的概率，无法完全避免。因此，有强一致性要求的数据，不能放缓存。
回答:首先，采取正确更新策略，先更新数据库，再删缓存。其次，因为可能存在删除缓存失败的问题，提供一个补偿措施即可，例如利用消息队列。

问题3：

缓存穿透：即黑客故意去请求缓存中不存在的数据，导致所有的请求都怼到数据库上，从而数据库连接异常。:

解决方案:
(一)利用互斥锁，缓存失效的时候，先去获得锁，得到锁了，再去请求数据库。没得到锁，则休眠一段时间重试
(二)采用异步更新策略，无论key是否取到值，都直接返回。value值中维护一个缓存失效时间，缓存如果过期，异步起一个线程去读数据库，更新缓存。需要做缓存预热(项目启动前，先加载缓存)操作。
(三)提供一个能迅速判断请求是否有效的拦截机制，比如，利用布隆过滤器，内部维护一系列合法有效的key。迅速判断出，请求所携带的Key是否合法有效。如果不合法，则直接返回。

问题4：

缓存雪崩，即缓存同一时间大面积的失效，这个时候又来了一波请求，结果请求都怼到数据库上，从而导致数据库连接异常。:

解决方案:
(一)给缓存的失效时间，加上一个随机值，避免集体失效。
(二)使用互斥锁，但是该方案吞吐量明显下降了。
(三)双缓存。我们有两个缓存，缓存A和缓存B。缓存A的失效时间为20分钟，缓存B不设失效时间。自己做缓存预热操作。然后细分以下几个小点

I 从缓存A读数据库，有则直接返回

II A没有数据，直接从B读数据，直接返回，并且异步启动一个更新线程。

III 更新线程同时更新缓存A和缓存B。

问题5：redis的并发竞争key问题
分析:这个问题大致就是，同时有多个子系统去set一个key。这个时候要注意什么呢？提前百度了一下，发现答案基本都是推荐用redis事务机制。但是不推荐使用redis的事务机制。因为我们的生产环境，基本都是redis集群环境，做了数据分片操作。一个事务中有涉及到多个key操作的时候，这多个key不一定都存储在同一个redis-server上。
回答:
(1)如果对这个key操作，不要求顺序
这种情况下，准备一个分布式锁，大家去抢锁，抢到锁就做set操作即可，比较简单。
(2)如果对这个key操作，要求顺序
假设有一个key1,系统A需要将key1设置为valueA,系统B需要将key1设置为valueB,系统C需要将key1设置为valueC.
期望按照key1的value值按照 valueA-->valueB-->valueC的顺序变化。这种时候我们在数据写入数据库的时候，需要保存一个时间戳。假设时间戳如下

系统A key 1 {valueA 3:00}
系统B key 1 {valueB 3:05}
系统C key 1 {valueC 3:10}
那么，假设系统B先抢到锁，将key1设置为{valueB 3:05}。接下来系统A抢到锁，发现自己的valueA的时间戳早于缓存中的时间戳，那就不做set操作了。以此类推。
问题6：先写MySQL数据库，再删除Redis缓存；还是先删除缓存，再写库，都有可能出现数据不一致的情况。举一个例子：
1.如果删除了缓存Redis，还没有来得及写库MySQL，另一个线程就来读取，发现缓存为空，则去数据库中读取数据写入缓存，此时缓存中为脏数据。
2.如果先写了库，在删除缓存前，写库的线程宕机了，没有删除掉缓存，则也会出现数据不一致情况。
因为写和读是并发的，没法保证顺序,就会出现缓存和数据库的数据不一致的问题。

回答：

采用延时双删策略：

先删除缓存；
再写数据库；
休眠500毫秒；（休眠时间需要评估自己的项目的读数据业务逻辑的耗时）
再次删除缓存。

异步更新缓存(基于订阅binlog的同步机制)

技术整体思路：

MySQL binlog增量订阅消费+消息队列+增量数据更新到redis
读Redis：热数据基本都在Redis
写MySQL:增删改都是操作MySQL
更新Redis数据：MySQ的数据操作binlog，来更新到Redis

Redis更新
1）数据操作主要分为两大块：
一个是全量(将全部数据一次写入到redis)
一个是增量（实时更新）增量：指的是mysql的update、insert、delate变更数据。

2）读取binlog后分析，利用消息队列,推送更新各台的redis缓存数据。
一旦MySQL中产生了新的写入、更新、删除等操作，就可以把binlog相关的消息推送至Redis，Redis再根据binlog中的记录，对Redis进行更新。

canal(阿里的一款开源框架)，通过该框架可以对MySQL的binlog进行订阅，而canal正是模仿了mysql的slave数据库的备份请求，使得Redis的数据更新达到了相同的效果。

_long_ago

关注

0
点赞
踩
4

收藏

觉得还不错? 一键收藏
0
评论
缓存技术~

平常使用的关系型数据库有Mysql、Oracle以及SqlServer等，在开发的过程中，数据通常都是通过Web提供的数据库驱动来链接数据库进行增删改查。那么，日常使用的数据库的数据都储存在哪里呢？以Mysql为例。打开Mysql所在的文件夹目录下的data文件夹可以发现，里面都是创建的数据库，打开其中一个，可以看到创建的表，他们以文件(格式frm和ibd)的形式存在。也就是说，日常使用的...
复制链接

扫一扫