长尾理论
传统的80/20原则(80%的销售额来自于20%的热门品牌)在互联网的加入下会受到挑战。互联网条件下,由于货架成本极端低廉,电子商务网站往往能出售比传统零售店更多的商品。虽然这些商品绝大多数都不热门,但与传统零售业相比,这些不热门的商品数量极其庞大,因此这些长尾商品的总销售额将是一个不可小觑的数字,也许会超过热门商品(即主流商品) 带来的销售额。主流商品往往代表了绝大多数用户的需求,而长尾商品往往代表了一小部分用户的个性化需求。
因此,如果要通过发掘长尾提高销售额,就必须 充分研究用户的兴趣 ,而这正是个性化推荐系统主要解决的问题。推荐系统通过发掘用户的行为,找到用户的个性化需求,从而将长尾商品准确地推荐给需要它的用户,帮助用户发现那些他们感兴趣但很难发现的商品。
互联网数据分布满足一种称为 PowerLaw 分布3
PowerLaw还有好几种变形,最著名的就是 Zipf's law4与 Pareto Distribution。
现实社会中用户面对很多选择做决定的过程:
- 社会化推荐(social recommendation),即让好友给自己推荐物品
- 基于内容的推荐(content-based recommendation)
- 找到和自己历史兴趣相似的一群用户,看看他们的选择,这种方式称之为基于协同过滤(collaborative filtering)的推荐
推荐算法的本质是通过一定的方式将用户和物品联系起来。
推荐系统就是自动联系用户和物品的一种工具,它能够在信息过载的环境中帮助用户发现令他们感兴趣的信息,也能将信息推送给对它们感兴趣的用户。