【每周代码】Reddit推荐算法源码学习

本文深入分析Reddit的推荐算法,包括话题和评论的排名机制。涉及内容包括时间权重、对数收缩、投票方向以及Wilson评分区间在评论排序中的应用。通过对源码的研究,解释了算法的工作原理,并探讨了其与其他排序算法的区别。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

2018.12.04补充:
在复制代码时候,CSDN卡死了,生无可恋.jpg
上次保存是三个小时之前。。。。。N多内容全部没有了
在研究源码的时候,发现网上现在的已有内容大部分基于我下面贴上的三位大神的分析,转载+复制粘贴+整理
但是其实代码在这段时间里已经发生了改进与优化,所以在整合大神的博客内容之外,我会增加部分优化内容的更新
-------这里是生无可恋内心绝望的分割线-----------------------------------------

上一篇每周一篇理论部分,断断续续写了两天多(后面还会不断地完善),真写的死去活来。
认真整理下来,才发现自己整个体系知识还不是很完善,日常学习或者应用中总是东一榔头西一棍子,非常的零散,很多东西了解的不是很透彻
在网上找资料的时候,发现写Reddit推荐算法的非常少,可能是因为它没有CF或者其他机器学习那么热门和基础吧,所以即使代码开源了讨论的人也很少,比较经典的几篇分析还需要翻墙(满脸泪)
但是我个人觉得,推荐算法的发展历程中,Reddit算法还是非常经典与重要的一环,它模型简单,效果还不错,非常适合入门以及小体量公司或者项目上手,虽然它的源代码对我这种菜鸡算是庞大的非常不友好了。。。。
所以这周的每周代码会重点分析reddit开源中的算法部分,会总结一些网上的内容和自己的理解。(主要参考链接如下)

reddit源码地址

Amir Salihefendic 读了源码后的分析
(这个原文版本需要翻墙)
分析的翻译版本
(这个版本无需翻墙)
reddit 评分算法的设计者之一 Randall Munroe 的博文
(这个好像不是原来的版本,但是是我试过可以国内打开的版本。。。。)
阮一峰的解析
(他写了一个系列,我自己也在看~如果觉得还不错的话下一篇文章会repo)

文章分为两部分,第一部分内容为Reddit是如何进行话题排名的。第二部分则讨论评论排名算法。和Hacker News不同,Reddit在这两部分的算法是不同的。
Reddit评论排名算法提出者叫做Randall Munroe(xkcd的作者ÿ

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值