目前的工作,需要我考虑下面的几个问题:
1、相关性推荐 为了什么?
2、衡量相关性推荐是否成功的指标 是什么?或者说,衡量我当前阶段工作是否有效的指标是什么?
3、采用什么方法?
我们网站为什么需要相关性推荐?
我的看法是,网站上内容很多,但是项目之间的联系性很差,用户进入一个也没之后,很容易就离开了。以博客 http://blog.myspace.cn/e/406203777.htm 为例,仅在博客结尾包含了上一篇、下一篇的链接。当然,如果能从产品上解决联系差的问题也很好。但是相关性推荐,可以提供一个统一的模块,无论用户当前看的是博客,还是论坛帖子、歌单、其他用户空间等,都可以根据相关性进行推荐,使他/她可以继续浏览。
另外,web 2.0,更讲究的是人与人之间的互动,为用户找出她感兴趣的产品、其他用户,或许可以激励她留言,与其他用户互动等。
而究其原因,我认为是:
1、把网站里的孤岛、或者类孤岛 给串联起来
2、把正确的内容,在正确的时间和地点,推荐给了正确的人
那么指标是什么呢?
以上效果,从表象上来看,貌似相关性推荐如果成功的话,是可以增加以下几点:
1、用户在网站的停留时间
2、用户浏览深度
3、被推荐页面的访问量
那么,我的看法是,首先从这几点入手,通过记录详尽的log进行效果的检查。
具体的方法?
目前相关性推荐的算法分两大类:1、内容相似度;2、协同过滤算法
对于算法,尚在学习中,以下随便记录一些想法:
我们的产品:
歌单、歌曲、音乐人空间、演出、各种市场活动、嘉宾直播、博客、相册、群组、论坛、微博客 等
我们的用户:
音乐人、歌迷、其他
衡量用户的方式:
她浏览的页面、发布的内容、好友与follow关系、个人资料 等,这些可以根据时间轴的远近,进行权重的区分
如果暂时抛开使用什么算法,我要的结果是什么呢?
当一个用户浏览一个页面时,计算出用户的偏好,并且根据当前页面的特征,推荐 :
1、编辑推荐的内容
2、同产品内部的其他页面
3、其他产品,相似属性的页面
如果用户点击了推荐的页面,记录,说明推荐生效;如果不点击,也记录,可能某些权重值就需要调整(有可能是仅针对这个人,也有可能是整个推荐算法)