帖子回复列表缓存优化日志

最新推荐文章于 2024-08-10 21:15:00 发布

weixin_34077371

最新推荐文章于 2024-08-10 21:15:00 发布

阅读量370

点赞数 1

文章标签：数据库数据结构与算法

原文链接：https://juejin.im/post/5992b3fa6fb9a03c315008bf

版权

尝试写点工作日志，也算是对平日工作的一些思考和总结。这次主要谈谈刚加入贝聊时接下的一个工作任务，对帖子回复列表接口做优化。

一、业务场景

类似于论坛、社区，有各种各样的帖子，用户可以在帖子下回复互动。

二、现状

目前帖子回复列表接口只对前两页数据做缓存，缓存时间为五分钟，string数据结构。当有新回复或者其它更新操作，则删除缓存。

三、存在问题

只对前两页做缓存，其它页都是直接从DB获取，遇到比较火的帖子会有大量请求到达DB，给DB造成压力。

四、目标

在尽可能少改动的前提下，提高帖子回复列表接口的缓存命中率，让绝大部分请求都能直接从缓存返回，减轻DB压力。

五、设计

使用Redis的Sorted Sets结构缓存帖子的回复信息，回复id当score，回复信息当member。

用增量方式更新缓存，有新回复，直接追加到sortedSet。同样，若删除回复，从Sorted Sets中移走该条回复。

利用Sorted Sets的排序功能，可直接获取某一页的数据返回。

说明：

1、考虑到实际场景，这里并没有缓存某个帖子所有的回复列表。因为用户翻查回复列表，大多数集中在前面几页，后面的极少会翻到，所以我们只缓存了400条数据，按一页20条数据，即20页。如果是超出20页的请求，则直接从DB获取数据返回。

2、帖子回复列表根据回复时间排序，新帖子在前面展示。这里用id当score，是因为我们的回复列表id是自增的，严格与回复创建时间保持一致的顺序。通过ZREVRANGE命令从大到小返回。

若id非自增，可以用回复时间当score。不过时间可能存在重复，若两个回复的时间一致，在查询列表时不存在问题，只是在删除具体某个回复时，不能通过ZREMRANGEBYSCORE命令删除（相同时间不能唯一确定一条回复数据）。

六、优点

1、在更新频繁情况下，依然能保持缓存高命中率。

例如运营在搞盖楼活动时，用户都在抢楼，帖子回复列表更新频繁。如果按之前方案，则前两页缓存会处于“建立-删除-建立”这么一个循环当中，命中率很低。同时还会有大量非前两页请求，DB压力非常大。

新方案是对缓存做增量更新，即使用户拼命抢楼，也能保证前面20页的数据命中缓存，减低DB压力。

2、在访问非前两页数据时，也能命中缓存。

虽然非前两页的请求量相对要低，但在总请求量很大的情况下，穿透缓存访问DB的量还是需要考虑的。这里提供前面20页的缓存，基本覆盖绝大部分请求。毕竟用户在一个帖子下翻了几十页的回复，这种情况基本没有。同时，在产品上，最好不要提供直接跳转第几页的功能。

七、优化前后数据对比

14号上线，对比上线前后4天的统计数据如下八、可能存在的问题

1、数据一致性：

若在增量更新缓存时操作失败，则缓存数据会跟DB数据不一致。

可以通过增加重试机制，降低概率。

或者先更新缓存，发布一个消息到消息队列，异步更新DB。

2、在缓存过期的瞬间，如果并发很高，可能存在多个请求做同样的操作（从DB获取数据，再set到缓存）

可以通过设置一个全局的标记位，若标记位已设置，则只执行从DB获取数据，不需要set到缓存。保证同时只有一个线程在执行set到缓存这一操作。

当然，若不作处理，对数据也无影响。

3、同样在缓存过期的瞬间，若同时存在查询和回复帖子操作，则有可能导致数据不一致

举个例子：

线程A查询列表，发现当前缓存不存在，则从DB获取数据，然后set到缓存。同时，线程B新增一回复，发现当前缓存不存在，直接更新DB。则有可能线程A set到缓存的数据没有包括线程B新增的回复。简单画个图如下：

解决方案：

将添加回复数据记录下来，在线程A将回复列表set到缓存后执行一个回调，将新增加的回复数据更新到缓存。补充：

（1）如果线程A获取的数据已经包含了新回复数据newReply，则线程在执行回调时会重复添加newReply数据到缓存，不过Sorted Set会自动识别为同一条数据，对结果无影响。

（2）如果线程A在线程B记录下回复数据newReply前就完成执行回调操作（此时newReply数据为空），则会导致DB、缓存数据不一致。

针对第（2）种情况，可以考虑在线程A执行完“将数据列表set到缓存”操作后，延时执行回调（例如5秒），基本可以解决此类问题。

4、若业务对此类数据没有强一致性要求，则以上三点均可不考虑。

weixin_34077371

关注

1
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

weixin_34077371 CSDN认证博客专家 CSDN认证企业博客

码龄9年

155: 原创

-: 周排名

44万+: 总排名

139万+: 访问

: 等级

8153: 积分

5434: 粉丝

275: 获赞

32: 评论

1462: 收藏

私信

关注

热门文章

最新评论

反码符号-128有8位二进制表示的原码、反码和补码
做而论道_CS: 计算机只用补码，原码反码都是不用的。计算机中，也根本就没有原码和反码。那么，从符号位原码反码入门，就是走入歧途了。因为，补码，与原码反码，并无半点关系。其实，补码，根本就没那么复杂。补码，仅仅是来自于【舍弃进位】而已。补码，也并非二进制才有。任何进制，都有补码的存在。你看十进制吧，两位，就是：0~99。你可以这么算：27 + 99 = (一百) 26 这么算也可以：27－1 = 26 你如果忽略进位，仍旧保持两位数，　这两种算法的功能，就是完全相同的。就是说，舍弃了进位：　正数，就能当负数使用。　加法，也就能完成减法运算。在计算机中舍弃进位：　负数和减法，就都没有了。　减法器，当然就没有用了。计算机有一个加法器，便可横行天下！舍弃进位，才是补码的来源和存在意义。两位十进制时，舍弃进位，就是减去一百。那么，加 99，再减 100，当然就是 “－1”。八位二进制，是：0000 0000~1111 1111。也就是十进制的：0 ~ 255。出现进位，就是：2^8 = 256。那么，加上 255 (1111 1111)再舍弃进位，也就是－1 了。同理，＋254 (1111 1110)，就是－2 了。　　　＋253 (1111 1101)，即－3。。。。以上这些正数，就是【代替负数的补码】。而正数，本来就是正数，不需要由谁来代替。所以，零和正数，其本身就是补码了。例：求－31 的八位补码是多少？解：2^8－31 = 256－31 = 225 　　 = 1110 0001 (二进制)。完事！什么符号位原码反码 ...，一概无用！计算机专家发明这些 “补码”，其理论基础，　只不过是小学学过的【进位】而已。但是，计算机专家并没有弄明白【舍弃进位】的意义。所以，就编造了一大滩垃圾知识：　机器数真值符号位原码反码补码正数三码相同负数取反加一符号位也参加运算 ... 这些，一概都是无用的。老外数学水平洼得狠，这事早有定论。谁要是跟老外学算术，　立刻，马上，直接，就掉沟里去了！看过《卖拐》吧？你知道不知道：谁最能忽悠？当属计算机专业的专家和老师！
线程的缓存何时刷新？
总有一天你的谜底会解开: 为什么 int[] i=new int[1];就不行了
sql语句什么时候用双引号或者单引号
卡西莫多᭄ꦿ: 我认真看了三遍
将群晖 NAS 安全地暴露到公网中
佛了PK嗯热了: 后边的重温太棒了！一下就懂了
得到一个div下特定ID的所有标签
小橙几: 用原生js怎么写?

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。