算法
zhuhengv
这个作者很懒,什么都没留下…
展开
-
基于用户投票的排名算法(一):Delicious和Hacker News
互联网的出现,意味着"信息大爆炸"。用户担心的,不再是信息太少,而是信息太多。如何从大量信息之中,快速有效地找出最重要的内容,成了互联网的一大核心问题。各种各样的排名算法,是目前过滤信息的主要手段之一。对信息进行排名,意味着将信息按照重要性依次排列,并且及时进行更新。排列的依据,可以基于信息本身的特征,也可以基于用户的投票,即让用户决定,什么样的信息可以排在第一位。下面,我将整理和转载 2016-01-07 13:34:08 · 2002 阅读 · 0 评论 -
基于用户投票的排名算法(二):Reddit
Hacker News 排名算法的特点是用户只能投赞成票,但是很多网站还允许用户投反对票。就是说,除了好评以外,你还可以给某篇文章差评。Reddit 是美国最大的网上社区,它的每个帖子前面都有向上和向下的箭头,分别表示"赞成"和"反对"。用户点击进行投票,Reddit 根据投票结果,计算出最新的"热点文章排行榜"。怎样才能将赞成票和反对票结合起来,计算出一段时间内最受欢迎的文章呢?如果转载 2016-01-07 13:53:29 · 765 阅读 · 0 评论 -
基于用户投票的排名算法(三):Stack Overflow
Reddit 排名算法的特点是,用户可以投赞成票,也可以投反对票。也就是说,除了时间因素以外,只要考虑两个变量就够了。但是,还有一些特定用途的网站,必须考虑更多的因素。世界排名第一的程序员问答社区 Stack Overflow,就是这样一个网站。你在上面提出各种关于编程的问题,等待别人回答。访问者可以对你的问题进行投票(赞成票或反对票),表示这个问题是不是有价值。一旦有人回转载 2016-01-07 14:07:43 · 1506 阅读 · 0 评论 -
基于用户投票的排名算法(四):牛顿冷却定律
这个系列的前三篇,介绍了 Hacker News,Reddit 和 Stack Overflow 的排名算法。今天,讨论一个更一般的数学模型。这个系列的每篇文章,都是可以分开读的。但是,为了保证所有人都在同一页上,我再说一下,到目前为止,我们用不同方法,企图解决的都是同一个问题:根据用户的投票,决定最近一段时间内的"热文排名"。你可能会觉得,这是一个全新的课题,伴随着互联网而产生,需要转载 2016-01-07 14:50:20 · 6436 阅读 · 0 评论 -
基于用户投票的排名算法(五):威尔逊区间
迄今为止,这个系列都在讨论,如何给出"某个时段"的排名,比如"过去 24 小时最热门的文章"。但是,很多场合需要的是"所有时段"的排名,比如"最受用户好评的产品"。这时,时间因素就不需要考虑了。这个系列的最后两篇,就研究不考虑时间因素的情况下,如何给出排名。得分 = 赞成票 - 反对票假定有两个项目,项目A是60张赞成票,40张反对票,项目B是550张赞成票,450张反对票。请问,转载 2016-01-07 15:12:12 · 926 阅读 · 0 评论 -
基于用户投票的排名算法(六):贝叶斯平均
上一篇介绍了"威尔逊区间",它解决了投票人数过少、导致结果不可信的问题。举例来说,如果只有 2 个人投票,"威尔逊区间"的下限值会将赞成票的比例大幅拉低。这样做固然保证了排名的可信性,但也带来了另一个问题:排行榜前列总是那些票数最多的项目,新项目或者冷门的项目,很难有出头机会,排名可能会长期靠后。以IMDB为例,它是世界最大的电影数据库,观众可以对每部电影投票,最低为1分,最高为10分。转载 2016-01-07 15:26:02 · 1780 阅读 · 0 评论 -
随机音乐播放的算法
在浏览Spotify官方博客时被一篇介绍音乐随机播放算法的博客吸引,随后对这个问题小小研究了一下。随机播放音乐,这个功能太普通以至于以前从未考虑过其背后实现逻辑。Random还是shuffle我们经常使用的随机播放功能,在外国同行口中并不是叫Random播放,而是叫Shuffle,洗牌的意思。为什么不是Random?来看两个例子。在Spotify成立之初,他们使用一种叫「Fis转载 2016-01-11 13:56:33 · 9248 阅读 · 1 评论 -
Amazon的推荐系统
现在的推荐系统特别火啊。做得最好的应该是Amazon了。上面是Amazon的图书推荐。用的就是著名的协同过滤(Collaborative filtering)算法。 我们用一个简单的例子来说明。 下面是一个用户购买的书籍的表格。 上面的1表示购买,0表示没有购买。 那么我们怎么来给小明推荐书籍呢? 先来看看Amazon之前的传统的协同过转载 2016-01-11 15:27:13 · 4864 阅读 · 0 评论 -
基于用户的协同过滤推荐算法原理和实现
在推荐系统众多方法中,基于用户的协同过滤推荐算法是最早诞生的,原理也较为简单。该算法1992年提出并用于邮件过滤系统,两年后1994年被 GroupLens 用于新闻过滤。一直到2000年,该算法都是推荐系统领域最著名的算法。 本文简单介绍基于用户的协同过滤算法思想以及原理,最后基于该算法实现园友的推荐,即根据你关注的人,为你推荐博客园中其他你有可能感兴趣的人。基本思想转载 2016-01-12 10:54:03 · 651 阅读 · 0 评论