推荐系统
文章平均质量分 93
嫌疑人Y的执事
在赌城砌砖中...
展开
-
手搭深度推荐模型(五) DIN
注意力机制“注意力机制”来源于人类天生的“选择性注意”的习惯。最典型的例子是用户在浏览网页时,会有选择性地注意页面的特定区域,而忽视其他区域。近年来,注意力机制已经成功应用在各种场景下的推荐系统中了。其中最知名的,要数阿里巴巴的深度推荐模型,DIN(Deep Interest Network,深度兴趣网络)。Deep Interest NetworkDIN模型结构图如图所示:DIN模型依然是采用了基模型的结构,只不过是在这个的基础上加了一个注意力机制来学习用户兴趣与当前候选广告间的关联程度, 用论原创 2021-03-28 02:43:39 · 211 阅读 · 0 评论 -
手搭深度推荐模型(四) NFM
本文是笔者参与datawhale组织的深度推荐模型组队学习的分享,学习内容见本链接 ,本文中所指的教程即该链接中的相应文件。一、概念为了在稀疏条件下有更好的预测性能,2017年何向南教授等人在SIGIR会议上提出了NFM(Neural Factorization Machines)模型。传统的FM及其改进的FFM本质是一个二阶特征交叉模型,尽管其处理稀疏向量的能力很好,但是由于FM的特征交叉是一种暴力组合,无法扩展到更高阶,因此限制了FM的表达能力。因此作者尝试使用非线性表达能力强的MLP部分代替了原F原创 2021-03-24 18:14:31 · 414 阅读 · 0 评论 -
手搭深度推荐模型(三) DeepFM
本文是笔者参与datawhale组织的深度推荐模型组队学习的分享,学习内容见本链接 ,本文中所指的教程即该链接中的相应文件。DeepFM这篇比之前两篇更难理解了一些,DeepFM对Wide&Deep的改进主要在于wide侧使用了FM,而FM又使用了矩阵分解的思想,因此这篇我回顾一下从传统机器学习到DeepFM每个算法都在注重解决什么问题,帮助自己理解DeepFM。一、协同过滤 CF协同过滤的总体思路是建立m个用户与n个物品的共现矩阵,通过使用余弦相似度、皮尔逊相关系数等计算相似度的算法,计算用原创 2021-03-21 22:38:23 · 360 阅读 · 0 评论 -
手搭深度推荐模型(二) Wide&Deep
本文是笔者参与datawhale组织的深度推荐模型组队学习的分享,学习内容见本链接 ,本文中所指的教程即该链接中的相应文件。why Wide&Deep?上一篇笔者实现了Deep Crossing模型,Deep Crossing采用了Embedding + MLP的结构,是推荐系统领域应用深度学习的首篇完整论文,它主要是将深度学习的强泛化能力引入了推荐系统,使模型能够有较强的推理能力,在提高新鲜度、挖掘相关关系不明显的物品时非常有用。但是在推荐领域还有很多应该被推荐的东西都是很直白的,很显然的。原创 2021-03-19 01:17:29 · 305 阅读 · 0 评论 -
手搭深度推荐模型(一) DeepCrossing
本文是笔者参与datawhale组织的深度推荐模型组队学习的分享,学习内容见本链接 ,本文中所指的教程即该链接中的相应文件。传统推荐系统模型有协同过滤、矩阵分解、FM算法等,随着算力的提升以及层出不穷的算法,深度学习技术逐渐在推荐系统中展露手脚,因为深度学习有更强的表达能力,有更灵活的网络结构。DeepCrossing是深度学习开始在推荐系统领域大显身手的标杆,本篇文章从论文总结、模型实现两个方面入手,深入学习Deep Crossing。论文总结本章基于5W1H法,对论文整理总结。(what) D原创 2021-03-17 02:12:25 · 319 阅读 · 0 评论 -
推荐系统实战之排序层
前言目前还没跑出结果,内容为转载。排序模型通过召回的操作, 我们已经进行了问题规模的缩减, 对于每个用户, 选择出了N篇文章作为了候选集,并基于召回的候选集构建了与用户历史相关的特征,以及用户本身的属性特征,文章本省的属性特征,以及用户与文章之间的特征,下面就是使用机器学习模型来对构造好的特征进行学习,然后对测试集进行预测,得到测试集中的每个候选集用户点击的概率,返回点击概率最大的topk个文章,作为最终的结果。排序阶段选择了三个比较有代表性的排序模型,它们分别是:LGB的排序模型LGB的分类转载 2020-12-06 17:25:16 · 521 阅读 · 0 评论 -
推荐系统实战之特征工程
推荐系统实战之 特征工程前言本次特征工程任务我主要从理论出发,加强对推荐系统的特征工程的了解。本文主要参考了王喆大佬的《深度学习推荐系统》,将从推荐系统的视角出发,结合本次新闻推荐比赛的实际案例,探讨推荐系统的特征工程。数据决定了机器学习模型的上限,特征则是对数据的表达,特征工程就是利用工程化的方法寻找对数据更好的表达。在推荐系统中,数据分为用户信息、物品信息和场景信息。推荐系统的特征工程就是利用工程手段从“用户信息”“物品信息”“场景信息”中提取特征的过程。构建推荐系统特征工程的原则由于用户的行原创 2020-12-03 20:28:58 · 1835 阅读 · 3 评论 -
召回评估
召回评估本次task多路召回任务比较陌生,代码量比较大,还需要一些时间理解。因此我选择针对一些重点内容逐一查阅资料来建立更深刻的理解。先从召回评估开始,逐步窥探召回层的相关内容。**todo:**目前整理了有哪些方法,后续再细探每种评估方法的优缺点,并将本次多路召回算法中的评估方法替换成其他评估算法来寻找差别为什么进行召回评估当前推荐系统的模型并不是端到端的,通常包括召回层与排序层,召回层负责将大量数据快速缩小,为排序层提供快速精简且有效的输入,因此,召回的结果决定了排序层模型性能的上限,因此需要对原创 2020-12-02 18:51:03 · 366 阅读 · 0 评论