搜广推
文章平均质量分 78
transformer_WSZ
You Only Look Once!
展开
-
DSSM双塔特征交互
传统的DSSM双塔无法在早期进行user和item侧的特征交互,这在一定程度上降低了模型性能。我们想要对双塔模型进行细粒度的特征交互,同时又不失双塔模型离线建向量索引的解耦性。下面介绍两篇这方面的工作。more。原创 2024-07-09 01:42:56 · 891 阅读 · 0 评论 -
Learn To Rank
在信息检索中,给定一个query,搜索引擎召回一系列相关的Documents,然后对这些Documents进行排序,最后将Top N的Documents输出。more排序问题最关注的是各Documents之间的相对顺序关系,而不是各个Documents的预测分最准确。原创 2024-07-07 19:50:15 · 600 阅读 · 0 评论 -
转化延迟预估
转化数据延迟久,但实时反馈至关重要涉及到模型预估准度,进而影响客户成本。more现状:超过12h的转化被视为负例,12h以内的为正例,这样会导致模型低估。P转化∣点击未转化点击延迟≤12h的转化延迟12h的转化延迟≤12h的转化。原创 2024-04-09 01:01:24 · 362 阅读 · 0 评论 -
MIND解读
这篇paper的核心是胶囊网络,该网络采用了动态路由算法自动对用户历史行为序列进行聚类,提取出多个兴趣向量,代表用户的不同兴趣。当用户再有新的交互时,通过胶囊网络,还能实时的改变用户的兴趣表示向量,做到在召回阶段的实时个性化。more。原创 2024-02-28 03:01:00 · 855 阅读 · 0 评论 -
TDM检索技术讲解
召回的任务是从海量商品库中挑选出与用户最相关的topK个商品。传统的召回检索时间复杂度是ON,而阿里的TDM通过对全库商品构建一个树索引,将时间复杂度降低到OlogN。more。原创 2024-02-27 02:19:47 · 917 阅读 · 0 评论 -
新一代粗排系统COLD
为了让粗排支持交叉特征来提升模型性能,同时又为了降低引入交叉特征、复杂模型所带来的预估延迟和资源消耗,阿里团队提出了COLD,在模型效果和算力间取得了平衡。more。原创 2024-02-21 01:55:24 · 340 阅读 · 0 评论 -
SENet在双塔中的应用
ENet并不能将user侧和item侧的特征交互提前或者使其获得更深层次的交互,user侧和item侧的特征交互仍然只发生在最后的内积那一步,这是由其双塔结构导致的。SENet的作用是提前将各侧的重要特征升权,不重要特征降权。原创 2024-02-06 01:50:51 · 428 阅读 · 0 评论 -
常见的相似性度量方法
有如下几种计算相似性方法:more。原创 2023-09-14 01:41:02 · 202 阅读 · 0 评论 -
莫比乌斯召回系统介绍
当前召回系统只能召回相关性高的广告,但不能保证该广告变现能力强。莫比乌斯做了如下两点创新:more。原创 2023-09-14 01:30:29 · 154 阅读 · 0 评论 -
召回和排序的样本构造问题
精排正样本:曝光点击负样本:曝光未点击粗排正样本:曝光点击负样本:如果只复用精排的负样本,粗排模型对精排模型的拟合就会出现比较大的偏差。因为粗排打分高的item可能会被精排打低分,导致不能下发曝光。而精排的正负样本量很少,粗排只见到了精排的样本,对于自己打分高的item,并不知道其正负属性,在下一次打分中,可能仍然会对其打高分。因此除了精排的负样本,仍然需要从精排未下发的item中负采样一部分,作为粗排的负样本。召回正样本:曝光点击负样本:曝光未点击+全库随机负采样。召回线上面临的原创 2023-09-14 01:23:23 · 218 阅读 · 0 评论 -
AUC & GAUC
这两种指标常用于衡量模型性能的好坏。more。原创 2023-07-27 02:47:19 · 353 阅读 · 2 评论 -
CVR预估中的多任务学习
该工作认为ESM2中引入的用户行为是宏观行为。在这些宏观行为之外,还可以观察到很多微观行为(比如在点击商品后,查看商品大图、查看评论、咨询客服等等),这些微观行为也可以辅助进行cvr预估。用户点击商品后,除了直接购买外,还会有加入购物车等行为,这些对产生转化也有决定性的影响。因此建模这些行为序列也是多任务学习的重要方向。经典之作,不解释了。转载 2023-03-13 00:55:10 · 139 阅读 · 0 评论