如果我有100万个用户,我就为他们做100万个亚马逊网站 ——Jeff Bezos
说到推荐系统,可能大家首先会想到个性化推荐,如淘宝、亚马逊等网站都在使用个性化商品推荐系统。进一步可能会想到基于用户推荐、基于内容推荐、基于关联规则推荐、协同过滤等等,可以说现在我们经常用的各种在线服务都或多或少的使用了这项技术来提高他们的服务。
二、面临的问题
数据稀疏:数据规模越大越稀疏,
冷启动:主要是新用户的推荐问题
大数据处理与增量计算:如何高效的处理大量的数据
多样性与精确性
推荐系统的脆弱性:算法能否在一定程度上保持对恶意攻击的鲁棒性
用户行为挖掘与用户画像:深入挖掘用户的行为模式可提高推荐的效果和在更复杂的场景下进行推荐
社会推荐:用户更喜欢来自朋友的推荐而不是被系统算出来的推荐,社会影响力被认为比历史行为的相似性更加重要
三、目前主要使用的推荐算法
1、基于内容的推荐
基于内容的推荐系统中,是通过相关内容的特征属性来定义,系统基于用户评价对象的特征,学习用户的兴趣,考察用户资料与待预测项目的相匹配程度。而用户的资料模型取决于所用学习方法,常用的有决策树、神经网络和基于向量的表示方法等。基于内容的用户资料是需要有用户的历史数据,用户资料模型可能随着用户的偏好改变而发生变化。
优点:1)没有冷启动、新项目和数据稀疏问题
2)能为具有特殊兴趣爱好的用户进行推荐
缺点:1)所推荐的内容必须能抽象出有意义的特征,并且具有良好的结构性
2、协同过滤推荐
协同过滤推荐(Collaborative FilteringRecommendation