![](https://img-blog.csdnimg.cn/20201014180756927.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
论文阅读
文章平均质量分 94
莫彩
首先是一个人,然后是一个程序员
展开
-
LTR入门:从 Ranknet 到 LambdaMart 原理与 lgb 实战
我们的任务是这样的:有一堆搜索引擎拿到的 query,我们标注了他们对购买商品的需求等级,即这个 query 的搜索者有多希望看到搜索结果里出现电商或者直播等内容来满足购买需求,我们希望搞一个 rank 任务来学习这个任务。doc 的特征以数值类特征为主,我们使用 lightgbm 来完成这个任务。原创 2023-01-09 01:01:51 · 1605 阅读 · 0 评论 -
On the Factory Floor: ML Engineering for Industrial-Scale Ads Recommendation Models笔记
对于工业规模的广告系统来说,广告点击率(CTR)的预测是一个核心问题。广告点击率构成了用户参与的一个重要类别,并经常被用作广告对用户有用性的主要信号。此外,在按点击率收费的广告系统中,广告商按点击率收费,点击率预期直接反馈到价值评估中。因此,对于大多数互联网广告公司来说,点击率模型的开发是一项重大投资。针对这些问题的工程需要许多适合在线学习的机器学习(ML)技术,这些技术远远超出了传统的准确性改进,特别是关于效率、可重复性、校准和信用归属。我们提出了一个部署在谷歌搜索广告CTR模型中的实用技术的案例研究。原创 2022-11-13 14:04:18 · 408 阅读 · 0 评论 -
Detecting Topic Authoritative Social Media Users: a Multilayer Network Approach
在过去几年中社交媒体和微博网站的迅速普及之后,识别具有影响其他用户选择能力的用户是一项重要的研究课题,因为它可以为许多商业公司提供机会。但是,大多数现有方法都是通过依靠在连接具有不同类型相互关系的用户的网络上计算的中心性度量来检测影响者的。在本文中,我们提出了一种能够利用三层网络对这些用户的内容进行建模的方法,该方法通过利用他们发布的消息的内容来表达对项目的意见,从而找到有影响力的用户。层代表用户,项目和关键字,以及同一层的参与者之间的层内交互。原创 2022-11-10 00:22:46 · 123 阅读 · 0 评论 -
Generate Label from Click
给定该矩阵的值,我们可以通过计算第(K − 1)行的最大值来找到针对具有K类的分段的最佳净协议。也就是说,对于最优分区L∗,我们有我们将使用动态编程来填充计算 OPT 矩阵。我们定义了另一个二维矩阵B,其中,如果我们在位置i处插入最后一个断点的分段中的新断点,则B [j,i]是净协议的附加收益。对于k> 1,很容易看到对于k = 1,我们有OPT [1,i] = B [0,i]。现在,我们可以使用公式2以自下而上的方式填充矩阵OP T。算法的计算复杂度为O(Kn2)。原创 2022-11-09 23:59:08 · 212 阅读 · 0 评论