推荐系统(2)——推荐系统简介(发展与理论部分)

挖不动数据的小w

已于 2022-03-28 14:13:13 修改

阅读量3.6k

点赞数 2

分类专栏：推荐系统文章标签：推荐算法机器学习 jupyter 大数据

于 2022-03-28 13:37:19 首次发布

本文链接：https://blog.csdn.net/qq_41161373/article/details/123788440

版权

4 篇文章 2 订阅

订阅专栏

推荐系统介绍

Data(数据)->Features(特征)->ML Algorithm(机器学习算法)->Prediction Output(预测输出)

数据来源：

请添加图片描述
从数据中筛选特征

上图数据图可以表示，用户1对ID为17的物品的评价为1（喜爱度），用户2没有用过此件物品，用户3对此件物品的评价为0.25…物品可以是电商的销售品，视频App的视频等，喜爱度可以是量化的对电商物品的评价，对视频App中视频的浏览时长与次数等。

用数据表示特征

请添加图片描述

算法和模型是推荐系统的核心，直接决定了推荐效果的好坏。在推荐系统中，算法要从两个方面来考虑：算法本身准确性和算法的效率。相对算法准确性，推荐系统工程化更关注的是算法效率。算法和模型层面主要包含如图所示。

请添加图片描述

从推荐算法主要可以从召回层和排序层两个方面来说（当然如果更细还有粗排和精排），虽然召回层和排序层都是使用算法和模型来做，但是针对于不用的阶段，所用的模型也有一定的差别。

在这里插入图片描述

我们所说的推荐算法或者说网络上常说的推荐算法一般是召回，在召回层中，我们又可以分为3类方法，即传统算法、机器学习和深度学习模型。

传统算法就是利用传统推荐系统理论中所采用的算法，例如计算用户之间的相似度、物品之间的相似度等，而这两类算法从大体上来讲，都可以用协同过滤算法来表示，只不过一个是基于用户的协同过滤算法，一个是基于物品的协同过滤算法
机器学习模型指使用机器学习相关算法来得到召回层结果的方法，例如NMF（Nonnegative Matrix Factor，非负矩阵分解）算法、LFM模型（Latent Factor Model，基于潜在隐因子模型）、FTRL（Follow The Regularized Leader）算法、PersonalRank算法等
深度学习模型指使用深度学习相关算法来得到召回层结果的方法，包括深度神经网络（DNN）和Embedding等方法

排序层中，我们也可以使用机器学习和深度学习两种方式来对召回结果进行排序，这里的排序一般采用点击率预估，并将预估得到的概率降序排序取前N得到最终的排序结果。

在使用机器学习进行排序层排序时，我们也可以将其分成2个大类，分别为线性模型和树模型，实际上，在真正的使用过程中，我们会将这两类模型结合起来使用。

在线性模型中主要使用逻辑回归作为主要的排序算法，而逻辑回归又属于线性回归的一种变形，因此，要想学习好逻辑回归，就得对线性回归有一定的了解。
树模型是排序算法中用得最多的一种模型的统称，在排序层中常用的树模型又分为决策树模型和集成学习模型，常用在推荐系统中的有随机森林、Boosting、GBDT、XGB、LGB。

在这里插入图片描述
虽然排序层的机器学习算法会被分为线性模型和树模型两种，但是进行排序时一般将二者结合使用，其中常见的组合方式就是使用GBDT+LR的方式进行点击率预测和排序层的排序。

在这里插入图片描述
至此，推荐结果就展现在我们的手机上了

关注