Ads
文章平均质量分 94
csdn0006
公众号:深度学习黑板报
展开
-
深度学习模型交叉特征建模不理想?试试DCNv2[论文笔记&源码解读]
论文介绍DCN-v2优化了DCN的cross layer,权重参数w由原来的vector变为方阵matrix,增加了网络层的表达能力;同时,为了保证线上应用的耗时不会因为cross layer参数量的增加而增加。观察到cross layer的matrix具有低秩性,使用矩阵分解,将方阵matrix转换为两个低维的矩阵、最后在低秩空间内,利用MoE多专家系统,对特征交叉做非线性变化,进一步增加对交叉特征的建模。vector -> matrix; moe设想:DCNv2是不是可以结合多任务学习、MM原创 2021-01-01 12:33:30 · 1260 阅读 · 0 评论 -
计算广告之淘宝oCPC智能出价
Paper:Optimized Cost per Click in Taobao Display Advertising解决问题淘宝作为世界上最大的电商平台,每天为上百万的广告主提供十亿多在线广告曝光的机会。从商业目的上说,广告主为特定的场景和目标人群进行竞标以竞争商业流量。平台方在十毫秒内选择合适的广告进行展现曝光。常见的出价方法有cpm和cpc。实现流量和广告的精准匹配,oCPC出价,实现高转化高出价,低转化低出价;同时优化版cpc能实现平台、广告主、用户的三方共赢。传统广告系统以固定的出价来瞄原创 2020-11-24 23:18:52 · 1909 阅读 · 0 评论 -
推荐论文阅读之多任务建模ESM2
介绍CVR转化率预估过程中存在样本选择偏差和数据稀疏问题。这两个问题在阿里的上一篇论文ESMM中有提到,这里介绍一下。样本选择偏差:CVR模型建模通常使用点击后的样本post-click,或者说使用记录用户在点击后是否产生订单的数据;而模型在实际应用过程中是在整个样本空间上,用户还没有发生点击。这就导致数据有偏,不同分布。在post-click样本上建模后,在实际应用过程中并不能保证模型的准确性,而且应用模型的泛化能力。数据稀疏:在电商系统,如淘宝,用户的行为链,通常包括曝光、点击、购买,各个原创 2020-11-21 22:50:32 · 630 阅读 · 0 评论 -
AUC、ROC详解:原理、特点&算法
前言接收者操作特征曲线(ROC)可以用来对分类器的表现可视化,可以依据分类器在ROC上的表现来选择最终的模型。分类性能TP、FP、TN、FN以二分类问题为例,每个实例I将会被映射到正例和负例上{p,n}。模型会将每个实例一个预测结果,结果可能是连续的,也可能是离散的;对于连续的结果,需要根据阈值再进行分类。为了和分类标签区分,我们使用{Y,N}表示每个样本的预测结果。给定一个分类器和一个样本,会有4个输出。如果样本是正例而且被预测为正例,则归为TP;如果被预测为负例,则归为FN;如果样本是负例而且被原创 2020-09-06 22:38:06 · 3423 阅读 · 0 评论 -
论文笔记-Factorization Machines
因子分解机Factorization Machine的提出是对标SVM和矩阵分解,如SVD++、PITF、FPMC模型。FM集成了SVM的优点,可以应用在任意的实值特征向量上。相比于SVM,FM可以通过分解参数对变量之间的交互建模,因此可以应用于数据稀疏的问题上,来对特征之间的交互进行估计,SVM在这类问题上没有很好的发挥。FM的计算时间可以优化到线性时间,因此FM可以直接优化。不同于对偶SVM,FM不用对原问题进行对偶求解,模型参数可以直接估计计算,不需要支持向量。其他的分解方法,如矩阵分解、并行因子原创 2020-08-26 23:32:45 · 243 阅读 · 0 评论 -
【论文笔记】CVR预估之ESMM模型
概述预测post-click转换率CVR在排序系统如推荐系统、广告中是至关重要的。传统的CVR模型使用深度学习方法已经实现到state-of-the-art水平。但是在实际应用中会遇到几个特定的问题让CVR模型建模变得困难。比如,传统的CVR模型是在点击曝光样本上训练的;但是最终是在整个样本空间上进行应用(曝光样本空间)。这就造成了样本选择偏差问题(Sample Selection Bias)。此外,数据稀疏问题让模型训练变得困难。在这篇论文中,提出利用用户行为序列数据,如曝光—>点击—>转化原创 2020-08-12 23:05:42 · 1756 阅读 · 0 评论 -
【论文笔记】Optimized Cost per Click in Taobao Display Advertising
解决问题淘宝作为世界上最大的电商平台,每天为上百万的广告主提供十亿多在线广告曝光的机会。从商业目的上说,广告主为特定的场景和目标人群进行竞标以竞争商业流量。平台方在十毫秒内选择合适的广告进行展现曝光。常见的出价方法有cpm和cpc。实现流量和广告的精准匹配,oCPC出价,实现高转化高出价,低转化低出价;同时优化版cpc能实现平台、广告主、用户的三方共赢。传统广告系统以固定的出价来瞄准特定属性的人群和广告放置位置,本质上被视为出价和流量质量的粗粒度匹配。广告客户为争夺不同质量要求而设定的固定出价无法完全原创 2020-08-09 23:20:55 · 904 阅读 · 0 评论