推荐系统原理简析

个性化推荐
个性化推荐根据用户兴趣和行为特点,向用户推荐所需的信息或商品,帮助用户在过载信息中快速发现真正所需的商品,提高用户黏性,促进信息点击和商品销售。推荐基于海量数据挖掘分析的商业智能平台,推荐主要基于以下信息:
–热点信息或商品
–用户信息,如性别、年龄、职业、收入、所在城市
–用户历史浏览或购买行为记录
–社会化关系

 

推荐发展历程
–1995年3月,卡耐基.梅隆大学的Robert Armstrong等人在美国人工智能协会上提出了个性化导航系统Web Watcher; 斯坦福大学的Marko Balabanovic等人在同一会议上推出了个性化推荐系统LIRA;
–1995年8月,麻省理工学院的Henry Lieberman在国际人工智能联合大会(IJCAI)上提出了个性化导航智能体Litizia;
–1996年,Yahoo 推出了个性化入口My Yahoo;
–1997年,AT&T实验室提出了基于协同过滤的推荐系统PHOAKS和Referral Web;
–1999年,德国Dresden的Tanja Joerding实现了个性化电子商务原型系统TELLIM;
–2000年,NEC研究院的Kurt等人为搜索引擎CiteSeer增加了个性化推荐功能;
–2001年,纽约大学的Gediminas Adoavicius和Alexander Tuzhilin实现了个性化电子商务网站的用户建模系统1:1 Pro;
–2001年,IBM公司在其电子商务平台Websphere中增加了个性化功能,以便商家开发个性化电子商务网站;

 

推荐目标
–提高单个信息或商品被访问的机会
–增加用户滞留时间,提高用户黏性
–促进信息访问或商品销售
–帮助用户发现感兴趣的信息或商品,提高用户体验

 

典型代表
–电子商务:Amazon、eBay、淘宝网、当当网
–IPTV:Netflix、Youtube、Pandora、Last.fm、土豆
–SNS:Facebook、Twitter、Del.icio.us、豆瓣

 

如何工作?
–用户信息收集,如个人信息、历史行为、评分、社会化关系
–用户偏好分析,如喜好特征、用户分类/聚类
–个性化推荐,如协同过滤、关联规则

 

主要问题
–缺少数据:数据越多,推荐越精确
–数据变化:数据不断变化,历史数据是否仍然生效?
–用户偏好变化:用户可能存个多个偏好,并会发生变化
–精确推荐困难:有些用户是多样化和不可预测的
–推荐系统复杂:海量数据、算法、实时性、精确性

 

推荐分类
–个性化推荐:根据用户行为历史进行推荐
–社会化推荐:根据相似用户行为历史进行推荐
–基于物品推荐:根据物品本身的特征进行推荐

 

推荐依据
–Friendship,如Facebook
–Membership,如Digg
–Familiarity
–Trust / distrust
–Follow,如Twitter
–Similarity

 

推荐特点
–以用户为中心,建立用户行为模型
–有记忆的,进化的系统
–由知识形成系统结构

 

主要推荐算法
–协同过滤(Collaborative filtering):这是目前应用最为成功和广泛的推荐算法。它充分利用集体智慧,在大量用户或物品中搜索,并从中发现品味相近的用户或属性相近的物品,据此构造经过排序的推荐列表。
–关联规则(Correlation Rule):挖掘物品的空间上的相关性,即发现同时被访问或购买的物品,据此为用户推荐。最为成功和经典的例子就是沃尔玛超市的物品排列-尿布和啤酒放在一起销售和例子。
–分类/聚类(Classification/Clustering):物以类聚,人以群分。同一类别的用户喜欢的东西,非常可能也是你喜欢的。算法来发现用户群组,并根据群组中其他用户浏览或者购买的物品来为当前用户推荐。
–基于内容(Content-based):分析物品内容或属性来构造相关性,据此构造推荐列表。这种算法主要用于电子信息物品的推荐,如网页、ebook、图片、音乐、视频。
–混合推荐:综合运用以上多种推荐算法进行推荐,不同算法之间可以取长补短。但增加了一定的复杂性,而且推荐结果也不容易解释。

 

推荐难点问题
–新物品冷启动
–用户兴趣过多
–用户打分稀疏性
–算法可扩展性
–海量数据存储与分析

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
项目完整可用,配合压缩包内数据库可直接运行使用。 eclipse+mysql5.7+jdk1.8 功能:推荐引擎利用特殊的信息过滤(IF,Information Filtering)技术,将不同的内容(例如电影、音乐、书籍、新闻、图片、网页等)推荐给可能感兴趣用户。通常情况下,推荐引擎的实现是通过将用户的个人喜好与特定的参考特征进行比较,并试图预测用户对一些未评分项目的喜好程度。参考特征的选取可能是从项目本身的信息中提取的,或是基于用户所在的社会或社团环境。 根据如何抽取参考特征,我们可以将推荐引擎分为以下四大类: • 基于内容的推荐引擎:它将计算得到并推荐给用户一些与该用户已选择过的项目相似的内容。例如,当你在网上购书时,你总是购买与历史相关的书籍,那么基于内容的推荐引擎就会给你推荐一些热门的历史方面的书籍。 • 基于协同过滤的推荐引擎:它将推荐给用户一些与该用户品味相似的其他用户喜欢的内容。例如,当你在网上买衣服时,基于协同过滤的推荐引擎会根据你的历史购买记录或是浏览记录,分析出你的穿衣品位,并找到与你品味相似的一些用户,将他们浏览和购买的衣服推荐给你。 • 基于关联规则的推荐引擎:它将推荐给用户一些采用关联规则发现算法计算出的内容。关联规则的发现算法有很多,如 Apriori、AprioriTid、DHP、FP-tree 等。 • 混合推荐引擎:结合以上各种,得到一个更加全面的推荐效果。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值