1.1 什么是推荐系统
个性化推荐系统:一个自动化的工具,它可以分析你的历史兴趣,从庞大的信息中找到符合你兴趣的物品供你选择。
充分研究用户的兴趣正是个性化推荐系统主要解决的问题。推荐系统通过发掘用户的行为,找到用户的个性化需求,从而将长尾商品准确地推荐给需要它的用户,帮助用户发现那些他们感兴趣但很难发现的商品。
几种方式:
(1)社会化推荐
让好友给自己推荐物品
(2)基于内容的推荐
通过分析用户曾经看过的电影找到用户喜欢的演员和导演,然后给用户推荐这些演员或者导演的其他电影
(3)基于系统过滤的推荐
如果能找到和自己历史兴趣相似的一群用户,看看他们最近在看什么电影,那么结果可能比宽泛的热门排行榜更能符合自己的兴趣。
推荐算法的本质是通过一定的方式将用户和物品联系起来,而不同的推荐系统利用了不同的方式。
1.2 个性化推荐系统的应用
个性化推荐系统在这些网站中的主要作用是通过分析大量用户行为日志,给不同用户提供不同的个性化页面展示,来提高网站的点击率和转化率。广泛利用推荐系统的领域包括电子商务、电影和视频、音乐、社交网络、阅读、基于位置的服务、个性化邮件和广告等。
1.3 推荐系统评测
准确的预测并不代表好的推荐。好的推荐系统不仅仅能够准确预测用户的行为,而且能够扩展用户的视野,帮助用户发现那些他们可能会感兴趣,但却不那么容易发现的东西。同时,推荐系统还要能够帮助商家将那些被埋没在长尾中的好商品介绍给可能会对它们感兴趣的用户。
常用指标:准确度、覆盖度、新颖度、惊喜度、信任度、透明度等。
1.3.1 推荐系统实验方法
主要有3种评测推荐效果的实验方法,即离线实验(offline experiment)、用户调查(user study)和在线实验(online experiment)。
(1)离线实验
优点:
不需要有对实际系统的控制权
不需要用户参与实验
速度快,可以测试大量算法
缺点:
无法计算商业上关心的指标
离线实验的指标和商业指标存在差距
(2)用户调查
用户调查需要有一些真实用户,让他们在需要测试的推荐系统上完成一些任务。在他们完成任务时,我们需要观察和记录他们的行为,并让他们回答一些问题。最后,我们需要通过分析他们的行为和答案了解测试系统的性能。
测试用户也不是随便选择的。需要尽量保证测试用户的分布和真实用户的分布相同。用户调查要尽量保证是双盲实验,不要让实验人员和用户事先知道测试的目标,以免用户的回答和实验人员的测试受主观成分的影响。
优点:
是可以获得很多体现用户主观感受的指标,相对在线实验风险很低,出现错误后很容易弥补。
缺点:
是招募测试用户代价较