算法思想为什么重要,通过IMDB学习算法的设计思路

阅读本文大约需要2分钟

截至2018年,IMDB(互联网电影数据库)已收录电影470+万,该平台有一个特色的top250电影排名。为了保证排名的权威性,确保用户对平台的信任度,IMDB在推荐机制上花了不少精力。作为产品/项目经理,你是否有考虑过如何保证产品的权威性,增强用户粘度?现在开始,不妨将智能化的推荐机制加入到你的产品/项目中。

 

XX年XX月XX日  IMDB Top10电影:

 

IMDB Top250的排名算法(贝叶斯平均算法)结合了贝叶斯分类算法和加权平均的思想。其实简单剖析下,你就明白其中的原理:

1)平均分:有v个人对一部电影打分,那么通常会用平均分来排名:

平均分R=(X1+X2+...+Xv) / v

2)避免恶意打分:平均分有一个很大的问题,如果只有一个或很少的人打分,比如我看了这部电影打了10分或0分,难道能说明这部电影就是好片或烂片吗?因此,IMDB引入了一个绝对投票数m的概念(IMDB定义为前10部电影的投票数)来稀释只有少数人打分的偏见,公示变为:

电影评分S = (X1+X2+...+Xv) / (v+m) = v*R/(v+m)

3)解决受众面问题:像好多文艺片,受众面比较小,分母增加m必定会拉低他们的分数,在分子中也应该加上m。IMDB又引入了一个所有电影平均分C,作为m的分数,公式最终如下:

电影最终评分WR = (v*R+m*C) / (v+m)

 

如何将算法应用到系统呢?

1、首先需要获取数据库中的用户评分和项目内容的矩阵;

2、按照推荐算法的公式,计算得到相关的数据并存储在数据库中;

3、然后预测分数的结果并将结果存储在数据库中;

4、最后给出推荐的评价标准,并且评估推荐算法的结果。

 

涨知识的推荐算法里程碑:

1、IMDB(互联网电影数据库)在其top250中应用贝叶斯平均算法得到加权分,向用户推荐加权分最高的250部电影[1]。

2、1992年,Tapestry系统应用协同过滤算法帮助员工处理电子邮件,加快了员工的工作效率,该系统也是协同过滤推荐算法最初的运用;

3、1994年,GroupLens系统开创了协同过滤推荐算法的里程碑,帮助观众过滤处理新闻的内容,这是如今各种推荐系统的雏形[2]。

4、2013年,谷歌因YouTube上的个性化视频推荐赢得了NATAS颁发的“技术与工程艾美奖”,推荐算法应该说是YouTube拥有的最有价值的资产。

 

有没有学到新知识?请将知识收为已用。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

Officetouch数据科学

将知识收为己用

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值