【学习笔记】推荐系统

Hung武

已于 2022-03-10 15:39:10 修改

阅读量864

点赞数

分类专栏：学习记录文章标签：深度学习人工智能

于 2022-03-06 20:17:36 首次发布

本文链接：https://blog.csdn.net/qq_31478771/article/details/123312115

版权

学习记录专栏收录该内容

52 篇文章 1 订阅

订阅专栏

概述

推荐系统的任务就是联系用户和信息，一方面帮助用户发现对自己有价值的信息，另一方面让信息能够展现在对它感兴趣的用户面前，从而实现信息消费者和信息生产者的双赢。

推荐系统不需要用户提供明确的需求，而是通过分析用户的历史行为给用户的兴趣建模，从而主动给用户推荐能够满足他们兴趣和需求的信息。推荐系统通过发掘用户的行为，找到用户的个性化需求，从而将长尾商品准确地推荐给需要它的用户，帮助用户发现那些他们感兴趣但很难发现的商品。

个性化推荐系统的主要作用是通过分析大量用户行为日志，给不同用户提供不同的个性化页面展示，来提高网站的点击率和转化率。个性化推荐的成功应用需要两个条件，第一是存在信息过载，用户看不完所有物品，第二是用户没有明确需求。

定义

没有明确需求的用户访问了服务，且服务的物品对用户构成了信息过载。系统通过一定的规则对物品进行排序，并将排在前面的物品展示给用户

要素

UI和UE（前端界面）
数据（Lambda架构）
业务知识
算法

架构

请添加图片描述
在这里插入图片描述

	搜索	推荐
行为方式	主动	被动
意图	明确	模糊
个性化	弱	强
流量分布	马太效应	长尾效应
目标	快速满足	持续服务
评估指标	简单	复杂

实验方法

离线实验

通过日志系统获得用户行为数据，生成一个标准数据集；
在数据集上进行训练，通过事先定义的离线指标评测算法在测试集上预测结果。

优点是速度快、不需要用户参与实验、不需要实际系统
缺点是无法获得点击率、转化率等商业关注指标、离线指标和商业指标存在差距

用户调查

用户调查需要有真实用户，需要用户在推荐系统上完成一些任务，记录用户行为，通过分析他们的行为了解系统性能。

优点是可以获得很多体现用户主观感受的指标
缺点是招募测试用户成本高，需要保证测试用户的分布与真实分布相同，需要保证是双盲实验

在线实验

AB测试通过一定规则将用户随机分成几组，并对不同组的用户采用不同的算法，通过统计不同组用户的各种不同的评测指标比较不同算法。

优点是可以公平获得不同算法实际在线时的性能指标
缺点是周期比较长，需要长期的实验才能得到可靠的结果。需要切分流量控制不同层之间的流量是正交的

评测指标

用户满意度：用户满意度只能通过用户调查或在线实验获得，主要通过调查问卷的形式。
在在线系统中，用户满意度主要通过一些对用户行为的统计得到。一般情况下可以用点击率、用户停留时长和转化率等指标度量用户的满意度。
预测准确度：通过离线实验计算，需要包含用户历史行为记录的数据集，通过在训练集上建立用户的行为和兴趣模型预测用户在测试集上的行为，并计算预测行为和测试集上实际行为的重合度作为预测准确度。
一般预测准确度指标有评分预测（通过均方根误差和平均绝对误差计算）、TopN推荐（通过准确率或召回率度量）、覆盖率（推荐出的物品占总物品集合的比例；为了保证所有物品出现次数差不多，用信息熵和基尼系数来衡量）
多样性：提高推荐列表的多样性，覆盖用户绝大多数兴趣点，增加用户找到感兴趣物品的概率。
新颖性：指给用户推荐他们没有听说过的物品。通过牺牲精度来提高多样性和新颖性是很容易的，困难的是如何在不牺牲精度的情况下提高多样性和新颖性。
惊喜度：令用户惊喜的推荐结果是和用户历史上喜欢的物品不相似，但用户却觉得满意的推荐。
信任度：如果用户信任推荐系统就会增加用户和推荐系统的交互。度量信任度只能通过问卷调查的方式，询问用户是否信任推荐系统的推荐结果。提高信任度的方法有增加推荐系统的透明度，提供推荐解释；其次是考虑用户的社交网络信息，利用用户的好友信息给用户做推荐，并用好友进行推荐解释。
实时性：实时性包括两个方面，首先需要实时地更新推荐列表来满足用户新的行为变化；第二是能够将新加入系统的物品推荐给用户，考验处理物品冷启动的能力。
健壮性：衡量推荐系统抗击作弊的能力，主要利用模拟攻击。
商业目标：注重网站的商业目标是否达成。