阿里DIN和SIM模型的分享

解决的问题:用户行为序列建模

解决方案:将embedding+sum_pooling的方式换成embedding+加权求和

1.DIN模型

将目标商品最为query,用户行为序列中的商品作为key和value

query和key计算activation weight,然后value再和activation weight相乘,得到新的embedding表示

将用户行为序列中的所有商品embedding相加,得到最后的用户行为embedding

2.SIM模型

解决的问题:用户行为序列很长的时候,DIN模型计算量会巨大,如果粗暴的只选前100作为用户行为序列,会丢掉用户的长期行为兴趣。

解决方案:用户行为序列先筛选一波,再进入模型

阿里的工业实践:

通过商品类目进行筛选,只有和候选广告类目相同的用户行为数据才会被选出送到下一级进行建模

(sooooo简单的一个操作,能让性能提升明显)

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值