设计一个属于自己的内容热度值算法

本文介绍了在社区改版中设计内容热度值算法的过程,参考了Hacker News等平台,并详细阐述了时间、互动量、内容和用户维度的考虑因素。算法采用牛顿冷却定律进行时间衰减,结合阅读量、回复量、收藏量和点赞量等互动指标计算热度值。同时,考虑内容质量和用户兴趣对推荐的影响,以实现更精准的个性化推荐。
摘要由CSDN通过智能技术生成

前言

在产品、运营这次做社区改版的过程中,我们大数据部门结合具体的业务细节,通过研究、讨论与试错,最终设计了一个基本符合需求的内容热度值算法,本文就简述其设计方法。

他山之石

有为数很少的几家外国公司开源或公开说明了自家的内容热度值算法,包括Hacker News、Reddit、Stack Overflow/Stack Exchange、StumbleUpon等。我们在设计自己的算法之前,参考了他们的一些理念。为了节省篇幅,就不再重复讲一遍了,直接将reference传送门放在下面:

https://moz.com/blog/reddit-stumbleupon-delicious-and-hacker-news-algorithms-exposed

https://github.com/reddit-archive/reddit/blob/753b17407e9a9dca09558526805922de24133d53/r2/r2/lib/db/_sorts.pyx

https://meta.stackexchange.com/questions/11602/what-formula-should-be-used-to-determine-hot-questions

https://meta.stackexchange.com/questions/60756/how-do-the-arbitrary-hotness-points-work-on-the-new-stack-exchange-home-page-a

可以攻玉

列举内容数据维度

在我们的社区体系中,与一篇内容相关的指标如下:

时间维度:

发布时间post_time、最后回复时间last_reply_time、最后操作时间last_op_time

互动量维度:

阅读量view_num、回复量reply_num、收藏量favor_num、点赞量like_num、回复点赞量reply_like_num、分享量share_num

内容维度:

内容长度content_length、平均回复长度reply_avg_length、图片数picture_num

用户维度:用户对内容的兴趣度、活跃度、发/回帖用户的声望,etc.

明确各维度的业务含义

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

码农老K

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值