推荐系统原理简析

最新推荐文章于 2023-02-07 10:28:46 发布

刘爱贵

最新推荐文章于 2023-02-07 10:28:46 发布

阅读量6k

点赞数

分类专栏：数据挖掘文章标签：电子商务算法 websphere yahoo last.fm ebook

本文链接：https://blog.csdn.net/liuaigui/article/details/6109173

版权

数据挖掘专栏收录该内容

4 篇文章 0 订阅

订阅专栏

个性化推荐
个性化推荐根据用户兴趣和行为特点，向用户推荐所需的信息或商品，帮助用户在过载信息中快速发现真正所需的商品，提高用户黏性，促进信息点击和商品销售。推荐基于海量数据挖掘分析的商业智能平台，推荐主要基于以下信息：
–热点信息或商品
–用户信息，如性别、年龄、职业、收入、所在城市
–用户历史浏览或购买行为记录
–社会化关系

推荐发展历程
–1995年3月，卡耐基.梅隆大学的Robert Armstrong等人在美国人工智能协会上提出了个性化导航系统Web Watcher; 斯坦福大学的Marko Balabanovic等人在同一会议上推出了个性化推荐系统LIRA；
–1995年8月，麻省理工学院的Henry Lieberman在国际人工智能联合大会（IJCAI）上提出了个性化导航智能体Litizia；
–1996年，Yahoo 推出了个性化入口My Yahoo；
–1997年，AT&T实验室提出了基于协同过滤的推荐系统PHOAKS和Referral Web;
–1999年，德国Dresden的Tanja Joerding实现了个性化电子商务原型系统TELLIM；
–2000年，NEC研究院的Kurt等人为搜索引擎CiteSeer增加了个性化推荐功能；
–2001年，纽约大学的Gediminas Adoavicius和Alexander Tuzhilin实现了个性化电子商务网站的用户建模系统1:1 Pro；
–2001年，IBM公司在其电子商务平台Websphere中增加了个性化功能，以便商家开发个性化电子商务网站；

推荐目标
–提高单个信息或商品被访问的机会
–增加用户滞留时间，提高用户黏性
–促进信息访问或商品销售
–帮助用户发现感兴趣的信息或商品，提高用户体验

典型代表
–电子商务：Amazon、eBay、淘宝网、当当网
–IPTV：Netflix、Youtube、Pandora、Last.fm、土豆
–SNS：Facebook、Twitter、Del.icio.us、豆瓣

如何工作？
–用户信息收集，如个人信息、历史行为、评分、社会化关系
–用户偏好分析，如喜好特征、用户分类/聚类
–个性化推荐，如协同过滤、关联规则

主要问题
–缺少数据：数据越多，推荐越精确
–数据变化：数据不断变化，历史数据是否仍然生效？
–用户偏好变化：用户可能存个多个偏好，并会发生变化
–精确推荐困难：有些用户是多样化和不可预测的
–推荐系统复杂：海量数据、算法、实时性、精确性

推荐分类
–个性化推荐：根据用户行为历史进行推荐
–社会化推荐：根据相似用户行为历史进行推荐
–基于物品推荐：根据物品本身的特征进行推荐

推荐依据
–Friendship，如Facebook
–Membership，如Digg
–Familiarity
–Trust / distrust
–Follow，如Twitter
–Similarity

推荐特点
–以用户为中心，建立用户行为模型
–有记忆的，进化的系统
–由知识形成系统结构

主要推荐算法
–协同过滤（Collaborative filtering）：这是目前应用最为成功和广泛的推荐算法。它充分利用集体智慧，在大量用户或物品中搜索，并从中发现品味相近的用户或属性相近的物品，据此构造经过排序的推荐列表。
–关联规则（Correlation Rule）：挖掘物品的空间上的相关性，即发现同时被访问或购买的物品，据此为用户推荐。最为成功和经典的例子就是沃尔玛超市的物品排列－尿布和啤酒放在一起销售和例子。
–分类/聚类（Classification/Clustering）：物以类聚，人以群分。同一类别的用户喜欢的东西，非常可能也是你喜欢的。算法来发现用户群组，并根据群组中其他用户浏览或者购买的物品来为当前用户推荐。
–基于内容（Content-based）：分析物品内容或属性来构造相关性，据此构造推荐列表。这种算法主要用于电子信息物品的推荐，如网页、ebook、图片、音乐、视频。
–混合推荐：综合运用以上多种推荐算法进行推荐，不同算法之间可以取长补短。但增加了一定的复杂性，而且推荐结果也不容易解释。

推荐难点问题
–新物品冷启动
–用户兴趣过多
–用户打分稀疏性
–算法可扩展性
–海量数据存储与分析