推荐系统
文章平均质量分 75
推荐系统
LightYoungLee
啊嘿嘿啊哈哈
展开
-
推荐系统(十九)推荐系统中的专业名词
tgi全称为target group index,即用户画像中的标签,比如用户是否有车,是否有房。参考用户画像TGI原创 2021-12-26 10:43:48 · 368 阅读 · 0 评论 -
推荐系统(十八)推荐系统中的MMOE
mmoe原创 2021-12-12 18:31:26 · 2315 阅读 · 0 评论 -
推荐系统(十七)推荐系统中的样本
推荐系统中构造样本方式原创 2021-12-05 22:53:14 · 1058 阅读 · 0 评论 -
推荐系统(十六)推荐系统中的attention机制
attention原创 2021-12-01 17:37:34 · 4497 阅读 · 0 评论 -
推荐系统(十四)重排算法
核心思想当精排吐出的推荐结果和用户的历史行为很类似时,会出现多样性指标不好的情况,因而需要添加额外的手段原创 2021-06-06 21:17:36 · 1571 阅读 · 0 评论 -
推荐系统(十三)样本采样
推荐系统在样本采样层面与广告系统的不同点对于ctr任务中的正负样本不均衡问题,不管是推荐系统还是广告系统,都是需要降采样才能使模型学习的更好,但降采样带来的问题是资源的预测ctr会有一定的偏差,即如果降采样前训练正负样本比例为1:1000,预测正负样本的分布基本在1:1000左右,即每个资源平均的预测ctr在1/1001左右。假如降采样到正负样本比例为1:10,每个资源的平均预测ctr也会在1/11左右。但正常情况下不会影响资源的相对排序,因而不管如何降采样,预测结果的auc是不会变化的。与推荐系统不同原创 2021-03-20 20:27:20 · 1483 阅读 · 0 评论 -
推荐系统(十五)多目标学习
应用场景多目标学习,顾名思义就是同时兼备多个目标,比如内容的点击率、点赞率以及完播率,那么如何设计一个推荐策略来很好地兼备这些目标呢,这里分阶段介绍一些概述性内容。第一阶段:通过样本权重实现多目标优化想象一个信息流推荐场景,用户可以滑动、点击并观看信息流推送的内容,这时的目标是保证点击率的情况下尽量保证完播率,即点击进去之后完整地看完资源,因为如果看完资源之后有相应的广告推送。这时可以把这个任务看成一个二分类问题,即点击或者完播都看成正样本,滑动看成负样本,但有一点不同的是完播的样本权重要大一些,比原创 2021-03-20 19:24:47 · 483 阅读 · 0 评论 -
推荐系统(十二)冷启动问题
概述目前冷启动问题主要有三类:用户冷启动、资源冷启动和系统冷启动。本文着重讲述用户冷启动和资源冷启动这两类问题。用户冷启动对于一个系统的新用户,没有播放行为,这时如何增加这部分用户的留存是推荐系统里一个很关键的问题,如下几项都是业界较为常见的解决方案。基于人口属性推荐系统后端数据中已经有针对不同人群的热门推荐资源,当用户第一次打开APP时,系统会提示用户选择用户的人口属性,之后系统可以根据用户选择项为用户推荐资源。基于兴趣标签和基于人口属性类似,在第一次打开APP时系统提升用户感兴趣的领域,之原创 2021-03-14 20:13:35 · 928 阅读 · 0 评论 -
推荐系统(十一)DSSM双塔模型
前言工作上将DSSM baseline模型引入组内推荐系统,这里总结下,方便后续回顾。原理原理较为简单,这里不再赘述,主要原理见下图:损失函数原始损失函数首先queryQQQ和docDDD之间的相似度为,其中yQy_QyQ和yDy_DyD为query和doc的embedding:R(Q,D)=cos(yQ,yD)=yQTyDT∣∣yQ∣∣∣yD∣∣R(Q,D)=cos(y_Q, y_D)=\frac{y^T_Q y^T_D}{||y_Q|||y_D||}R(Q,D)=cos(yQ,yD原创 2021-03-11 08:54:02 · 5424 阅读 · 0 评论 -
推荐系统(十)工作中模型指标评估
备用知识准确率和召回率的概念可以参考这里。召回策略中评估准确率和召回率手段在线准确率相对准确:一次下发中用户点击资源占这次下发所有资源的占比。在一般场景下线上准确率是相对较准的,但是对于首页轮播推荐不是特别准,因为这次下发的资源用户不一定都能看得到,这样计算出来的准确率应该要略低于实际的准确率。召回率不好评估且不准:可以通过下发前一段时间内用户观看的资源与本次下发进行交集计算,从而得到下发资源中有多少出现在用户点击资源中。离线离线评估时通常利用用户过去一段时间的历史作为训练数据,预测用户可原创 2021-03-06 13:58:46 · 632 阅读 · 0 评论 -
推荐系统(八)协同过滤之ItemCF
上一篇推荐系统(七)协同过滤之UserCF中UserCF的原理以及实验步骤,本篇着重讲述与之类似的ItemCF。基本原理核心思想找到和用户A看过物品相似的物品,向A推荐这些物品。物品相似度wi,j=∣N(i)⋂N(j)∣∣N(i)∣∣N(j)∣ w_{i,j} = \frac{|N(i)\bigcap N(j)|}{\sqrt{|N(i)||N(j)|}} wi,j=∣N(i)∣∣N(j)∣∣N(i)⋂N(j)∣计算物品相似度,就需要构建每个用户的对称物品矩阵,之后将这原创 2020-06-14 17:25:02 · 296 阅读 · 0 评论 -
推荐系统(七)协同过滤之UserCF
基本原理核心思想找到和用户A相似的其他用户,向A推荐这些其他用户喜欢的物品。用户相似度:wuv=∣N(u)⋂N(v)∣∣N(u)∣∣N(v)∣ w_{uv} = \frac{|N(u)\bigcap N(v)|}{\sqrt{|N(u)||N(v)|}} wuv=∣N(u)∣∣N(v)∣∣N(u)⋂N(v)∣N(u)代表的是用户u喜欢的物品集合,上述相似度衡量的是用...原创 2020-04-28 18:50:01 · 323 阅读 · 0 评论 -
推荐系统(九)Factor Machines
提纲由来:特征的稀疏性很高,如果特征之间相互独立,则会过拟合。FM可以学到这些特征之间的关系举例:论文中的举例,解释公式推导:要详尽背景有时系统中用户的行为比较稀少,采集到的样本很稀疏,这样直接导致常用的拟合方法学到的模型存在严重的过拟合问题,即特征之间存在严重的依赖和隔离关系,使得模型无法进一步学习到精准的内在规律。为了解决这一问题,FM模型应运而生,其基本原理是学到特征与特征之间的关系,从而达到更加精准的预测的目的。递进引用论文原文的图示,图中的一条样本描述了当前用户的id原创 2020-06-21 22:24:45 · 309 阅读 · 0 评论 -
推荐系统(六)推荐系统评估指标
Mean Average Precision (MAP)对于一个query iii, 如果某个系统检索出来的文档集合DOCDOCDOC中排在前面的文档都和iii相关,排在后面的都不相关,则证明这个系统的检索能力较强,因而基于这个思想,query iii的平均准确率(Average Precision, AP)应运而生,公式如下:AP=∑j=1niP(j)⋅yi,j∑j=1niyi,jAP =...原创 2020-03-25 15:15:27 · 1138 阅读 · 0 评论 -
推荐系统(五)Graph Convolution Network之原理篇
本文尝试通过最简单易懂的语言来讲解GCN(Graph Convolution Network)原理和作者提供的源码,希望能够帮助大家理解GCN。原创 2020-02-16 20:52:08 · 636 阅读 · 1 评论 -
推荐系统(四)Graph Embedding之Node2Vec
本文主要介绍Node2Vec算法如何对RandomWalk算法进行改进,得到更加合理的训练数据,进而通过Word2Vec模型学习的方式得到图中每个节点的Embedding向量。原创 2020-01-30 20:47:25 · 1908 阅读 · 0 评论 -
推荐系统(三)Graph Embedding之LINE
本文主要介绍LINE算法的具体流程,其中包括1. FIrst/Second - order Proximity构建模型2. 负采样+alias采样实现模型训练的加速3. 具体代码实现的细节原创 2020-01-29 19:22:13 · 1909 阅读 · 1 评论 -
推荐系统(二)Graph Embedding之DeepWalk
本篇博客概述了DeepWalk的由来以及算法的基本过程,其基本内容包括:1. Graph Embedding的由来,2. Graph Embedding中Graph的构建,3. RandomWalk+Word2Vec算法介绍,3. 代码实现,4. DeepWalk算法的缺点原创 2020-01-28 16:13:25 · 2429 阅读 · 2 评论 -
推荐系统(一)SVD基本思想以及推荐系统的应用
本文主要介绍SVD的基本思想以及其在推荐系统的中的两个拓展使用方法Funk-SVD和Bias-Funk-SVD,希望能够对推荐系统入门的小伙伴有所帮助。原创 2020-01-05 15:50:40 · 1663 阅读 · 0 评论