DMT推荐算法笔记

https://github.com/guyulongcs/CIKM2020_DMT

1、Motivation
在这里插入图片描述
2、Method
Deep Multifaceted Transformers(DMT)算法,使用多个Transformers同时建模用户多种行为序列,利用MMoE优化多个目标。另外,探索了消偏学习来减轻训练数据的选择偏差。
在这里插入图片描述

DMT包含3部分:Deep Multifaceted Transformers, Multi-gate Mixture-of Experts (MMoE) layers and a Bias Deep Neural Network:
1 Deep Multifaceted Transformers

Deep Multifaceted Transformers
为了捕捉用户的多种兴趣,使用独立的Deep Interest Transformers,建模用户的点击序列、购物车序列和购买序列来学习用户相应的短期、中期和长期的兴趣向量。

Deep Interest Transformer
对于每个行为序列,使用Deep Interest Transformer建模用户实时兴趣,将其表示为兴趣向量。encoder建模序列中商品的关系,decoder学习用户关于目标商品的兴趣向量。

Encoder. encoder对行为序列的embedding使用self-attention block,使得序列里的每个商品能与输入序列里的全部sku交互。self-attention机制建模用户行为序列中任意两个商品的相互关系,能够更好地从历史行为中学习用户的兴趣。

Decoder. 由于用户的兴趣是多样的,decoder使用目标商品做为query,encoder的输出做为keys和values。decoder学习目标商品和历史序列中每个商品的attention score,为每个目标商品学习唯一的兴趣表示。兴趣向量随着不同的目标商品而发生变化,提高了模型的表达能力。

2 Multi-gate Mixture-of-Experts Layers

在电商推荐系统中,通常有不同的学习目标,例如CTR、CVR和GMV。排序系统应该能够预估这些不同目标,结合这些目标得到一个最终的排序分数。为了刻画多任务的关系,使用MMoE来进行多目标排序。DMT在Deep Multifaceted Transformers层的输出后添加MMoE。

3 Bias Deep Neural Network

由于曝光的商品来源于之前的排序系统,并且用户会有选择偏差,排序模型使用隐式反馈数据进行训练会是有偏的。本文主要研究了电商系统中的两种选择偏差:Position bias 和Neighboring bias。Position bias是指用户倾向于点击排在靠前的商品。Neighboring bias是指商品被点击的概率受其附近的商品所影响。DMT使用Bias Deep Neural Network建模选择偏差。网络输入是bias特征。

4 Model Training and Prediction

Training 在训练阶段,对于每个任务 图片 ,预估分数 图片 由从多任务学
习层的 图片 和深度偏差网络 图片 使用sigmoid函数得到。对于每个任务使用交叉熵损失函数,总的loss 图片 为每个目标的loss加权和:、在这里插入图片描述
3、Experiments
在这里插入图片描述
4、Conclusions
在这里插入图片描述

  • 1
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 2
    评论
DMT(Discrete Multi-Tone,离散多音)。DMT采用多载波调制技术,可用频段划分为多个(典型为256个)子信道,每个子信道的带宽为4kHz,对应不同频率的载波,并根据子信道发送数据的能力将数据分配给各子信道,不能载送数据的子信道被关掉。DMT用离散快速傅立叶变换进行编解码,DMT尝试可能的最高速率,根据线路的噪声和衰减特性分配数据。目前,DMT已成为 ANSI制订的ADSL的调制标准——T1.413。 CAP(Carricerless Amplitude/Phase Modulation, 无载波调幅调相)。 CAP 是AT&T提出的调制方式,是一种无载波的正交幅度调制(QAM),数据信号在发送前被压缩,然后沿电话线发送,在接收端重组。CAP的主要优点为:载波频率可变,在一个频率周期或波特内传输2到9位二进制数据,因此在相同的传输速率下,占用更少的带宽,传输距离更远。 现在比较成熟的ADSL标准有两种——G.DMT和G.Lite。G.DMT是全速率的ADSL标准,支持8Mbps/1.5Mbps的高速下行/上行速率,但是,G.DMT要求用户端安装POTS分离器,比较复杂且价格昂贵;G.Lite标准速率较低,下行/上行速率为1.5Mbps/512Kbps,但省去了复杂的POTS分离器,成本较低且便于安装。就适用领域而言,G.DMT比较适用于小型或家庭办公室(SOHO),而G.Lite则更适用于普通家庭用户。 由于CAP信号传输占用全部信道带宽,所以频域和时域噪声都会对它造成影响。DMT的每个很窄的子信道频带内的电缆特性可以近似认为是线性的,因此脉冲混叠可以减到最低程度。在每个子信道内传送的比特率可以按该信道内信号和噪声的大小自适应地变化,故DMT技术可自动避免工作在干扰较大的频段。   DMT和CAP技术都可以实现速率的自适应调整,这就是RADSL。不同的是DMT可以做到从64kbps开始以32kbps的间隔平滑递增。而CAP只能从640kbps开始作较粗糙的调整。   CAP的优点是处理较DMT简单,故时延小,芯片功耗低、其商品化也走在DMT方式之前。DMT的优点是抗噪声性能比CAP好。两种技术互不兼容,设备之间无法互连,影响了ADSL的推广。不过现在市场上的产品基本上以CAP调制技术为基础。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值