拉手网-个性化推荐方法与系统设计

团购网站的个性化推荐技术是指利用算法和技术向用户提供商品信息和建议,帮助用户决定应该购买什么产品,模拟销售人员帮助用户完成购买过程的技术。个性化推荐技术的作用主要表现在,

1、将团购网站的浏览者转变为购买者;

2、提高团购网站的交叉销售能力。比如,购买了某商场电影票的用户极有可能会在影院周边做餐饮等相关消费。

3、改善用户体验 , 提高用户忠诚度。智能决策能很大程度上提高团购网站的用户粘性。

个性化推荐技术的核心是推荐算法,现有的各种推荐算法有其适用的环境,在具体环境中使用合适的算法会对推荐结果产生非常重要的影响。

一个成功的个性化推荐系统,能够帮助用户快速找到或发掘出感兴趣的商品,这样可以极大地便利用户,而且会使用户对个性化推荐系统产生依赖,养成长期使用的习惯,对网站保持用户忠诚度有着很大的作用。

个性化推荐系统的两个挑战

将个性化推荐系统适用在大型团购网站上,主要面临如下几个挑战:

1、推荐质量。在大型团购网站,商品数量很庞大,用户有过行为(浏览、购买、评分等)的商品数量占的比例极小,因此数掘稀疏性很高。另外,使用不同的推荐算法对推荐质量的影响也很大。如何提高推荐质量是个性化推荐研究的一个重要挑战。

2、实时性。推荐的精度和所需的时间是矛盾体。推荐精度高的算法往往需要较长的计算时间。但是在线推荐对实时性的要求较高,因此往往需要牺牲一部分的推荐质量。如何在满足实时性的前提下保证推荐质量是个性化推荐研究的另一个重要挑战。

个性化推荐系统的主要问题

1、稀疏性问题。随着团购网站的快速发展,网站中的用户和商品也越来越多,用户数据和商品数据都朝着海量方向发展,随之产生了一个问题:把用户作为行,商品作为列构成的用户-商品矩阵中,有效的用户-商品数据只占了很小的一部分,即每个用户有过浏览、评价等行为的商品只占总商品数的很小一部分。数据越稀疏,个性化推荐系统的推荐质量、推荐实时性挑战越大。

2、冷启动问题。团购网站在持续运营的过程中,会有新的用户不断涌入。当一个新用户进入个性化推荐系统时,由于该用户在系统中没有可供参考的历史记录,系统不能识别其偏好,从而很难对其产生个性化推荐。对于新商品来说亦然,由于对新商品的不了解,系统难以将其与其他商品计算相似度,新商品就不容易出现在推荐结果中。

3、可扩展性问题。个性化推荐系统的数据一般是海量动态的,在个性化推荐系统运行的过程中,会不断有新的数据加入进来。个性化推荐系统需要在原有数据的基础上,把新加入的数据也结合到系统里来,以丰富训练数据,提高推荐质量。

4、实时性问题。实际应用中,很大一个比例的个性化推荐系统的作用是在线实时推荐,需要系统能及时响应用户的请求。而由于数据量的巨大,在保证准确率的同时保证实时性是个两难问题。

常用的个性化推荐方法

目前的个性化推荐系统使用的算法主要有如下几种,基于关联规则的推荐算法,基于内容的推荐算法,基于协同过滤的推荐算法,基于隐语义模型的推荐算法。

1、基于关联规则的推荐方法(Association Rule-based Recommendation),是比较传统的方法。基于商品在用户购物车中的共现率进行推荐。由于有的团购商品上线时间较短,因此导致共现信息很少或根本不存在,所以该方法不能适用于团购商品的推荐。

2、基于内容的推荐方法 (Content-based Recommendation)。内容过滤主要采用自然语言处理、人工智能、概率统计和机器学习等技术进行过滤。通过相关特征的属性来定义项目或对象,系统基于用户评价对象的特征学习用户的兴趣,依据用户资料与待预测项目的匹配程度进行推荐,努力向用户推荐与其以前喜欢的产品相似的产品。

3、协同过滤推荐方法(Collaborative Filtering Recommendation)。协同过滤是在信息过滤和信息系统中正迅速成为一项很受欢迎的技术。与传统的基于内容过滤直接分析内容进行推荐不同,协同过滤分析用户兴趣,在用户群中找到指定用户的相似(兴趣)用户,综合这些相似用户对某一信息的评价,形成系统对该指定用户对此信息的喜好程度预测。协同过滤推荐方法的不足是,

1)用户对商品的评价非常稀疏,这样基于用户的评价所得到的用户间的相似性可能不准确(即稀疏性问题)。

2)随着用户和商品的增多,系统的性能会越来越低(即可扩展性问题)。 

3)如果从来没有用户对某一商品加以评价,则这个商品就不可能被推荐(即最初评价问题)。

4、基于隐语义模型的推荐

隐语义模型(latent factor model,简写为LFM)的核心思想是通过隐含特征(latent factor)联系用户兴趣和项目。由于人工对项目的分类存在不能代表用户意见,难以控制分类粒度,难以给一个项目多个分类,难以给出多维度分类,以及难以决定一个项目在某一分类中的权重等问题,研究人员考虑从数据入手,自动地找到项目的类,采用的是基于用户行为统计的自动聚类方法。LFM模型在推荐的准确度上优于协同过滤算法,但在实际应用中因为耗时太久,不能提供实时推荐。经典的LFM模型每次训练时都需要扫描所有用户行为记录,这样才能计算出用户隐类向量和项目隐类向量,而且LFM的训练需要在用户行为记录上反复迭代才能获得较

  • 1
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值