《机器学习:算法原理和编程实践》4:推荐系统原理





2、协同过滤及其算法

     协同过滤通过用户和产品及用户的偏好信息产生推荐的策略,最基本的策略有两种:一种是找到具有类似品位的人所喜欢的物品;另一种是从一个人喜欢的物品中找出类似的物品。这就是两个最知名的类别推荐技术:基于用户的推荐技术和基于物品的推荐技术,它们被称为协同过滤。

     协同过滤可以利用用户和物品的信息来预测用户的好恶,并发现新的用户还不知道的东西,形成促销策略。这就完成了推荐系统的核心思想。

     数据预处理:收集了用户行为数据,我们还需要对数据进行一定的预处理,减燥和归一化是最常用的方法,其目的是为了下一步的聚类。

      为了减少计算的开销,可以先对UI矩阵中的记录进行聚类,根据聚类的结构在运用SVD算法。

      KMeans(也称为K均值)是典型的基于距离的排他的划分方法:给定一个n个对象的数据集,它可以构建数据的k个划分,每个划分就是一个聚类,并且k<=n,同时还要满足两个要求:每个组至少包含一个对象,每个对象必须属于且仅属于一个组。



    SVD原理和计算:SVD隐语义模型最早在文本挖掘领域被提出,用于找到文本的隐含主题,也被称为主题模型。相关的名词有LSI、pLSA、LDA和Topic Model。隐语义模型的核心思想是通过隐含特征(Latent Factor)计算用户和物品的相似性。



  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值