多类型大批量数据排行榜计算项目实践

最新推荐文章于 2022-06-13 10:43:03 发布

瑞卡哥哥

最新推荐文章于 2022-06-13 10:43:03 发布

阅读量348

点赞数

分类专栏：算法 redis 数据结构

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/zhouqinghe24/article/details/117111791

版权

算法同时被 3 个专栏收录

12 篇文章 0 订阅

订阅专栏

2 篇文章 0 订阅

订阅专栏

1 篇文章 0 订阅

订阅专栏

背景,类似大众点评的门店评分系统,每个门店涉及多个类目每个门店有一个评分,根据类目和门店所在城市计算出评分的排行榜取top10,评分相同则取最小的门店id.门店数据有大概50万.分开类目城市参与排序数量有大概800万

鉴于背景,此项目计算肯定不能太大的时间复杂度,单拆分数据就已经有800万需要参与排序了,所以必然要用空间来换时间.而且还得将低排名的数据清理掉,最终保留top20 就已经满足要求了.

解决方案:

1.使用redis SortedSet有序集合来自动排序,使用已有的轮子来减少代码量

2.使用城市码+类目code 作为每个排行榜的key 每个门店的id 作为member score 则取评分*10000(因评分存储是小数点之后4位,即将评分得出一个整数)+.+(1-门店id/1000000) (这里将所有门店id 变成小于1的小数,用1-该小数之后,门店id越小,则得到的小数越大,作为score排序后是符合规则的)

示例:门店id 155 评分4.523 则score设置为45230.999845 member 155

门店id 156 评分4.523 则score设置为45230.999844 member 156

门店id 157 评分4.524 则score设置为45240.999843 member 156

排序后是157 155 156

3.然后多线程取出所有门店分页数据,挨个zadd进涉及到的城市+类目code的hashset中,每次zadd 后做一次取排序的20-30元素,zrem操作删除剩余1-20 也就是 800万次zadd 即可得出所有排行榜top

巧妙使用了redis的sortedset 的score 完成了拆分后几百个排行榜的top10 功能

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
多类型大批量数据排行榜计算项目实践

背景,类似大众点评的门店评分系统,每个门店涉及多个类目每个门店有一个评分,根据类目和门店所在城市计算出评分的排行榜取top10,评分相同则取最小的门店id.门店数据有大概50万.分开类目城市参与排序数量有大概800万鉴于背景,此项目计算肯定不能太大的时间复杂度,单拆分数据就已经有800万需要参与排序了,所以必然要用空间来换时间.而且还得将低排名的数据清理掉,最终保留top20就已经满足要求了.解决方案:1.使用redis SortedSet有序集合来自动排序,使用已有的轮子来减少代码量2..
复制链接

扫一扫

专栏目录

瑞卡哥哥 CSDN认证博客专家 CSDN认证企业博客

码龄16年

56: 原创

13万+: 周排名

138万+: 总排名

22万+: 访问

: 等级

2669: 积分

96: 粉丝

79: 获赞

36: 评论

29: 收藏

私信

关注

热门文章

分类专栏

最新评论

list sort()给自定义对象排序
瑞卡哥哥: List<T>的sort函数有个重载是接收一个比较方法作为参数。比较方法是要求返回值是int 参数为两个相同的泛型对象。你可以把你报错的贴出来，我猜不到
list sort()给自定义对象排序
$小生不才: 请问CompareByAge是如何成为参数传入sort而不报错的啊
多个数组全排列问题
瑞卡哥哥: 此算法作为北京单场彩票n串1 拆票算法
字符串拘留池（string interning pool）
无知是恶: 讲道理写的还不粗
枚举及为什么要用1，2，4，8这些2的n次幂来表示枚举的值
qq_42724296: 问一下，如何反推呢？比如： enum Province{ 广州 = 0, 北京 = 1, 上海 = 2, 深圳 = 3, 台湾 = 4, 香港 = 5, 澳门 = 6 } int value = 3 时，表示广州+北京 int value = 5 时，表示广州+上海 int value = 7 时，表示广州+北京+上海

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。