推荐排序
文章平均质量分 69
凝眸伏笔
纵然伤心也不要愁眉不展,因为你不知道谁会爱上你的笑容。
展开
-
catboost 的实例应用附带特征重要度打印
caboost实战样例、demo、以及特征重要度打印原创 2021-12-14 22:00:45 · 3628 阅读 · 1 评论 -
Item2Vector原理、在推荐系统中的应用、代码注解
1.背景:最早看到Item2vec是微软研究院的这篇文章,发表于2016年ICML。本文主要是对这篇论文做一些介绍,Item2vec主要思想是借鉴了Word2Vec,并且采用SGNS(Skip-gram + Negative Sampling,思想是用中心词预测周围的词)的方法来生成物品向量,最后只需要计算当前浏览的物品与其它物品的向量相似度,从而找到相似物品。一般像电商网站的“看了也看”、“买了也买”、“相似物品”模块比较适合应用Item2Vec算法。主要做法是把item视为word,用户的行为序原创 2020-06-15 21:51:59 · 2306 阅读 · 0 评论 -
【DNN】DIN原理-代码解读-应用过程中可能存在的难点
DIN(Deep Interest Network)很火,已经成功吸引了我的注意力,落地时,究竟难在什么地方?????本文的整体思路是:先熟悉原理,再看代码,然后在结合实际,猜想下可能难在什么地方。原理参考各位前辈的博客,结合论文,按照自己的理解习惯,汇总如下。论文下载点击这里。DIN要解决的问题:针对互联网电子商务领域,数据特点:Diversity、Local Activation。DIN给出的解决方案:使用用户兴趣分布来表示用户多种多样的兴趣爱好 使用Attention机制来实原创 2020-05-19 18:44:29 · 1990 阅读 · 0 评论 -
【召回】倒排索引怎么建立?基本概念和实现例子
0.召回相关的概念 召回(Recall):在搜索排序系统中,需要首先从全集商品中,选择一部分商品,用来展示给用户,这个选择的过程称之为召回。 文档(Document):一般搜索引擎的处理对象是互联网网页,而文档这个概念要更宽泛些,代表以文本形式存在的存储对象,相比网页来说,涵盖更多种形式,比如Word,PDF,html,XML等不同格式的文件都可以称之为文档。再比如一封邮件,一条短信,一条微博也可以称之为文档。在本书后续内容,很多情况下会使用文档来表征文本信息。...原创 2020-05-18 14:59:13 · 2365 阅读 · 0 评论 -
【DNN】W&D(Wide and Deep)
0.介绍Google 发表在 DLRS 2016 上发表的文章。Wide & Deep 模型的核心思想是结合线性模型的记忆能力和 DNN 模型的泛化能力,从而提升整体模型性能。该结构被提出后即引起热捧,在业界影响力非常大,很多公司纷纷仿照该结构并成功应用于自身的推荐等相关业务。我是在18年工作的代码中看到了这个模型,线上服务有wide deep类,但是模型迭代时,工具封装的太好了,都没有见到过显示的网络结构,只是将对应部分输入,然后得到模型,上线即可,今日来彻底捋捋这个框架。wide&原创 2020-05-08 17:49:04 · 1194 阅读 · 2 评论 -
端到端和非端到端的Embedding,以及embedding质量评估
Embedding 的训练可以分为两种方法:端到端(End-to-End)和非端到端的训练。端到端(嵌入层)端到端的方法是将 Embedding 层作为神经网络的一部分,在进行 BP 更新每一层参数的时候同时更新 Embedding,这种方法的好处是让 Embedding 的训练成为一个有监督的方式,可以很好的与最终的目标产生联系,使得 Embedding 与最终目标处于同一意义空间。(端...原创 2020-05-07 11:13:16 · 5268 阅读 · 4 评论 -
【ML】LambdaMART算法原理--应用场景
上篇介绍了lambdaRank,本篇介绍其演进LambdaMART。1.引言lambdaMart出现想解决什么问题?我们知道lambdaRank的主要突破点是:分析了梯度的物理意义;绕开了损失函数,直接定义梯度。LambdaRank 重新定义了梯度,赋予了梯度新的物理意义,因此,所有可以使用梯度下降法求解的模型都可以使用这个梯度,基于决策树的 MART 就是其中一种,将梯度 Lambd...原创 2020-05-04 18:28:31 · 3371 阅读 · 2 评论 -
【推荐】LambdaRank
上一篇文章简单介绍了Ranknet,这篇文章简单介绍下LambdaRank。1.前言RankNet 有哪些缺陷,为什么需要 LambdaRank?尽管 RankNet 取得了一些成功,但它存在一些缺陷,我们讲过 RankNet 本质上就是以错误的 pair 最少为优化目标,也就是说 RankNet 的直接目的就是优化逆序对数(pairwise error),这种方式一定程度上能够解决一...原创 2020-05-04 18:16:55 · 1926 阅读 · 0 评论 -
【推荐】RankNet
依次介绍RankNet,LambdaRank,LambdaMart。1.引言:RankNet 是 2005 年微软提出的一种 Pairwise 的 Learning to Rank 算法,它从概率的角度来解决排序问题。RankNet 的核心是提出了一种概率损失函数来学习 Ranking Function,并应用 Ranking Function 对文档进行排序。这里的 Ranking Fu...原创 2020-05-04 18:06:09 · 2771 阅读 · 0 评论