推荐系统
文章平均质量分 90
yichudu
code anything
展开
-
ctr 校准纠偏,保序回归
模型预测的 ctr 并不一定总是准的, 若只关注 auc 指标, 难以反映业务价值.原创 2023-02-07 19:41:05 · 1074 阅读 · 0 评论 -
因果效应,典型模型及wasserstein距离, BNN,CFR,SITE,NetDeconf
参考BNN, ICML2016CFR_net,ICML2017, paper, codeSITE,NeuralIPS2018NetDeconf,WSDM2020, paper, code原创 2021-08-23 20:19:15 · 1039 阅读 · 0 评论 -
因果推断, 因果效应概述
概述因果推断定义:从观测数据中找出变量间的因果性以及变量改变后, 它对结果的具体影响.从观测数据中找相关性并不难, 现在的机器学习也是在基于统计地从样本中学习 y^=f(x;θ)\hat y=f(\mathbf x;\theta)y^=f(x;θ) 的拟合关系. 但没有因果推断, 对于生活,工作的指导意义就大大减弱. 所以我们需要因果推断.随机对照实验, Randomized Controlled Trial (RCT), 是理论上完成因果推断的最佳方法, 但考虑实际, 有些实验是 expe原创 2021-07-05 16:15:58 · 4759 阅读 · 0 评论 -
流量调控与次模优化
边际效益递减边际效益递减, diminishing marginal return.是说生产要素的投入达到一定程度时, 继续增加一个单位的投入, 带来的收益增幅会逐步降低.复习考试举例举例如复习考试, 第一天的复习能多考36分, 第二天的复习只能多考28分.电商场景的流量分发假设一个商品的 ctcvr为p=0.1.其在第t次成交的概率=(1−p)(t−1)p(1)(1-p)^{(t-1)}p \tag 1(1−p)(t−1)p(1),其在前t次成交的概率为 1-P(前n次都不成交): 1−原创 2021-03-08 14:37:01 · 582 阅读 · 0 评论 -
SDM,长短期兴趣融合召回
目录SDM简述贡献网络结构user profile preferenceshort-term preferencelong-term preferencelong-short term fusion gatecandidate matchingpaper对比实验我的讨论参考SDM简述贡献在已有的 sequence-based 工作基础上,解决两个问题:session 中存在 multiple interest tendencieslong-term behaviors are various a原创 2020-08-07 15:44:55 · 946 阅读 · 0 评论 -
因果推断 在 电商权益发放 场景中的应用
本文未完成。应用场景为了促进转化,电商平台(如淘宝,拼多多)通常会给用户发放一些营销权益(红包,满减券等)。那么,如何精细化、个性化地决策,在同样的营销费用支出下,得到更多的转化呢?比如给定用户下,平台要不要发红包,发多大面额的红包,整体ROI才会更高,就需要因果推断建模了。因果推断在上文的电商营销场景下,X代表用户特征,T∈{t∣不同的红包面额}T\in \{t|不同的红包面额\}T∈{t∣不同的红包面额},Y∈{0,1}Y\in \{0,1\}Y∈{0,1}代表用户是否使用红包购物(即对红原创 2020-08-04 20:22:55 · 1483 阅读 · 1 评论 -
推荐系统中的GNN,图神经网络
简述session-based 方法(如 GRU4REC)表现活跃,比 i2i 好用,但被认为其不能建模 item 之间的复杂转移关系,所以GNN类的Rec论文活跃, 通过引入GNN思想可以取得性能提升。参考own blog, SR-GNN,图网络召回MGNN-SPred...原创 2020-07-26 21:23:11 · 1802 阅读 · 0 评论 -
ESMM CTCVR 多任务学习
介绍术语定义CTR,post-view Click-Through Rate,4% 量级。CVR, post-click ConVersion Rate, 5‰ 量级。CTCVR, post-view Click-Through&ConVersion Rate, 二者相乘,万分之二 量级。可以看到有 impression -> click ->conversion 的依赖路径。传统的CVR模型,训练样本就是 post-click items 。但预测时是在 post-v原创 2020-07-22 12:58:34 · 4833 阅读 · 0 评论 -
RNN for recommendation,GRU4REC
简述第一次将 RNN 用于 session-based rec。先空着。 反正 bert4rec 都把这些超了。参考GRU4REC,paper,SESSION-BASED RECOMMENDATIONS WITH RECURRENT NEURAL NETWORKS原创 2020-07-15 20:11:44 · 700 阅读 · 0 评论 -
List-wise Ranking
背景ranking is a prediction task on list of objects. 所以 point-wise, pair-wise 等方法的训练任务与工作场景有差异, list-wise 理应更好.list-wise ranking with S-IE该改论文见参考[1].Session Infomation Embedding (S-IE)算是一个预训练, task...原创 2020-03-08 15:21:09 · 3037 阅读 · 0 评论 -
SR-GNN, 图网络召回
简述将用户的session序列构建成有向图,通过考虑item之间的转移关系, 更好的学习item emb及用户的向量表达.related work一些流行的GNN演变.word2vec, DeepWalk, LINE, node2vec.结构及解读网络结构nodes connectionAsA_sAs is defined as the concatenation of two...原创 2020-02-25 23:04:54 · 1778 阅读 · 2 评论 -
MMoE 多任务学习
背景论文见[1].MMoE, Multi-gate Mixture-of-Experts.底层共享,上层拆塔,是多任务学习的常规实现. 论文提出了使用多个expert(其实就是DNN), 并使用多个gate(expert_num 的 softmax) 的架构设计, 直观明了.网络结构图: 多任务学习的网络架构演化, c 为MMoE网络架构gate图: 截自论文的 gate 说明...原创 2020-02-15 12:13:33 · 3913 阅读 · 0 评论 -
推荐系统常用评估指标
AUC同普通二分类问题的评价.Recall描述预测的topN, 与 用户实际点击的交集大小, 除以 实际点击的集合大小.公式(1)recall@N=∑useri∣{predictTopN}∩{click}∣∑useri∣{click}∣recall@N = \frac {\sum_{user_i} |\{predictTopN\}\cap \{click\} |} {\sum_{us...原创 2019-05-05 16:58:54 · 5060 阅读 · 0 评论 -
推荐系统中的召回阶段
用户与用户(商品)的关系可以用图 G=(V,E)G=(V,E)G=(V, E) 表示, 推荐系统的任务其实就是预测图中尚未存在的边, 叫link prediction。1.协同过滤具有相似消费行为的人,可以相互推荐。比如用户a、b同时购买了手机,a又购买了手机壳,那么b也是手机壳的潜在买家。 往往需要一个物品评分矩阵R,元素ri,jri,jr_{i,j}表示用户i对物品j的评分。一般...原创 2016-01-05 15:58:47 · 6876 阅读 · 2 评论 -
知识图谱与推荐
异构网络一些概念定义Heterogeneous Information Network, HIN, 异构信息网络. 信息网络用G={V,E}G={V,E}G=\{V,E\}表示, 若节点VVV与关系EEE都有类型的区别, 则称这个网络式异构的. 与之相对的叫同构网络. figure HIN的一个示例, 有四种节点类型与三种关系类型meta-path元路径. 异构...原创 2018-06-19 17:20:36 · 6985 阅读 · 0 评论 -
推荐系统的rank阶段(ctr 预估)
首先,特征交叉不是无限度的,两个万级别的特征,交叉之后就是亿级别,所以一般交叉特征都是2、3阶;其次,特征依赖于数据,当我们的数据来源不能继续增加的时候,新特征的设计就很难做了。推荐系统一般分为 召回, 排序, 展示打散 等几个阶段. 排序阶段较为重要, 从召回的上千个相关结果中, 预测出。同 常规的LR二分类任务, 见参考[15]. 只不过工业界的特殊之处在于 超大规模稀疏特征及特征的交叉.LR是广义的线性模型, 除了工程师精心构造的交叉特征, 此外不具备任何非线性的表达能力.figure WDL图解。原创 2018-05-21 11:29:21 · 10300 阅读 · 2 评论 -
推荐系统的多样性
背景如果是用 point-wise 的方法, 根据ctr做倒排, 会出现 high similar items were clustered together 的现象. 相似的item扎堆, 这种体验并不友好.submodular diversification参考[Adaptive, Personalized Diversity for Visual Discovery]...原创 2018-10-12 10:35:59 · 6328 阅读 · 0 评论 -
点击率 ctr 与停留时长 dwell time
参考JUMP: A Joint Predictor for User Click and Dwell Time原创 2018-12-05 14:27:21 · 2447 阅读 · 0 评论 -
点击率 ctr 与转化率 cvr
概念定义在广告和推荐场景中, 用户首先会看到平台给他生成的推荐结果, 称为曝光(impression), 用户会有一定的概率作点击(click), 进入详情页. 若果满意的话会购买产品, 称为转化(conversion).CTRClick Through Rate. 点击率.pCTR=p(click∣impression)pCTR=p(click|impression)pCTR=p(cl...原创 2018-12-03 14:39:24 · 19964 阅读 · 0 评论 -
线性模型中的特征工程
LR 模型靠特征的共现, 来记住它们对ctr的贡献.除去常规的特征交叉, 还要有一些ctr类的统计数据, 罗列见下.item 侧不同维度下, 多个内容的整体消费差异一个类目下,所有内容的ctr一个商铺下,所有内容的ctr不同维度下, 一个内容的消费差异一个内容, 在不同性别/年龄人群下的ctr一个内容, 在不同购买力人群下的ctruser 侧不同维度下, 一个人的消费偏好差异...原创 2018-12-26 15:22:44 · 923 阅读 · 0 评论 -
推荐系统数据集
RecSys 2015见参考[1].RecSys Challenge 2015.一家电商网站的点击和购买日志.train setSession ID, Timestamp ,Item ID ,Category ,Price , Quantity (how many of this item were bought)test setSession ID,Timestamp,Item ...原创 2018-12-11 11:14:25 · 5412 阅读 · 6 评论 -
推荐系统综述
目录:简述分阶段讨论1 离线数据准备11 协同数据12 特征数据2 在线召回21 u2i 查询22 i2i 召回23 打分3 排序31 基于规则32 基于模型33 多目标4 过滤与打散41 过滤最近已看42 类目打散5 bandit 探索推荐效果评价1 投放前评价2 投放后效果评价冷启动1新用户2新商品实时特征神经...原创 2018-01-25 16:07:59 · 7663 阅读 · 5 评论 -
lenskit (开源推荐系统) 简介
一个基于java的开源推荐系统,由明尼苏达大学的 GroupLens Research 研究小组出品。官网地址: http://lenskit.org/官方github地址: https://github.com/lenskit/lenskit我的demo地址,csdn code:https://code.csdn.net/chuchus/lenskitdemo/tree/master...原创 2016-01-13 10:13:31 · 4283 阅读 · 5 评论 -
推荐系统的冷启动
冷启动即新加入的user或item, 在 user-item 二部图中, 新节点的度是0, 所以针对它们如何推荐, 就称为冷启动问题. 包括 user,item 两部分的冷启动.参考RecSys2016,paper, Addressing Cold Start for Next-song Recommendation...原创 2018-07-02 20:15:05 · 1268 阅读 · 0 评论 -
推荐系统的EE(Explore-Exploit, 探索-利用)问题
用在个性化推荐中, 帮助用户探索新偏好, 不然推荐来推荐去都是差不多的东西. 用在热门非个性化推荐中, 不能每次都挑效果最好的那一批, 也要给新内容有出头之日的机会.Epsilon-GreedyUpper Confidence BoundUCB, Upper Confidence Bound, 上界置信区间.原创 2017-12-26 14:41:32 · 6289 阅读 · 1 评论 -
推荐系统中的矩阵分解(MF,FM,FFM)
在推荐场景中, 我们可以把user对item的行为, 用评分矩阵R∈R|U|×|P|R∈R|U|×|P|R\in \mathbb R^{|U|\times|P|}表示. UUU为用户集合, PPP为item集合, 以商品为例. 比如说用户u1对商品p1加购物车, 那就令 Ru1,p1=3Ru1,p1=3R_{u1,p1}=3, 用户u1对商品p2做出购买行为, 那就令 Ru1,p2=5Ru1...原创 2018-07-04 14:33:17 · 2925 阅读 · 0 评论