![](https://img-blog.csdnimg.cn/20201014180756918.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
推荐
文章平均质量分 91
十三吖
这个作者很懒,什么都没留下…
展开
-
《Deep Matrix Factorization Models for Recommender Systems》DMF模型及python代码
推荐系统通常使用user-item评分,隐式反馈和辅助信息进行个性化推荐。矩阵分解通过计算user之间或者item之间的相似性来达到针对某个user推荐一些item。在本文中,我们提出了一种新的基于神经网络结构的矩阵分解模型。首先,我们构造一个具有显式评级和非偏好隐式反馈的用户项矩阵。通过这个矩阵作为输入,我们提出了一个深层结构学习架构,以便为user和item学习一个共同的低维空间。其次,我们...原创 2019-05-27 08:01:16 · 3287 阅读 · 4 评论 -
《Product-based Neural Networks for User Response Prediction》PNN模型的理解与python代码
1 原文点击【原文】即可下载。2 PNNPNN(Product-based Neural Network),认为在embedding输入到MLP之后学习的交叉特征表达并不充分,提出了一种product layer的思想,既基于乘法的运算来体现体征交叉的DNN网络结构,模型如图所示PNN模型的输出:L2层输出:L1层输出:其中,lzl_zlz,lpl_plp以及b1b_1b...原创 2019-04-10 10:43:46 · 1197 阅读 · 0 评论 -
针对 特征 多值离散 的 embedding
现实中,存在以下情况:玩王者荣耀时,每个人喜欢的英雄有可能不同,有的人喜欢李白和阿珂;有的人喜欢伽罗和鲁班以及扁鹊,对于这种情况,称为多值离散特征。在博文原 《DeepFM: A Factorization-Machine based Neural Network for CTR Prediction》 DeepFM 模型及python代码 中,DeepFM模型将每个Feature转换成定长的...转载 2019-03-27 09:33:42 · 5273 阅读 · 1 评论 -
《DeepFM: A Factorization-Machine based Neural Network for CTR Prediction》 DeepFM 模型及python代码
如果不了解FM模型或者FFM模型可以查阅下面两篇文章:1、推荐系统 | 《Factorization Machines》 | FM模型及python实现2、《Field-aware Factorization Machines for CTR Prediction》FFM模型整理及python代码1 DeepFM模型论文原文2 模型2.1 CTR预估数据特点:1、输入中既...原创 2019-03-22 17:20:48 · 1945 阅读 · 1 评论 -
《Factorization Machines》 | FM模型及python实现
1 Factorization Machines 原文2 FM模型2.1 背景计算广告和推荐系统中,CTR预估是一个非常重要的环节,判断一个item是否应该被推荐要根据CTR预估的点击率进行。CTR预估时,除了单特征以外,往往需要组合特征。数据经过one-hot编码以后,导致样本数据变得非常稀疏,另外,还导致特征空间变大。为了解决数据稀疏(one-hot coding)情况下,...原创 2019-03-13 17:16:12 · 3230 阅读 · 1 评论 -
推荐算法之LFM模型及python
本文转自:推荐系统之隐语义模型(LFM)一 基本概念LFM(latent factor model)隐语义模型,这也是在推荐系统中应用相当普遍的一种模型。那这种模型跟ItemCF或UserCF有什么不同呢?这里可以做一个对比:对于UserCF,我们可以先计算和目标用户兴趣相似的用户,之后再根据计算出来的用户喜欢的物品给目标用户推荐物品。而ItemCF,我们可以根据目标用户喜欢的物品,寻找...转载 2019-03-13 10:16:01 · 3394 阅读 · 1 评论 -
笔记 | 推荐系统 —— 用户画像
【编程开发】某风网 大数据推荐系统算法工程师 项目实战原创 2019-03-13 09:17:50 · 970 阅读 · 0 评论 -
笔记 | 推荐系统 —— lambda架构
【编程开发】某风网 大数据推荐系统算法工程师 项目实战1 Lambda架构1.Lambda系统架构提供了一个结合实时数据和Hadoop预先计算的数据环境的混合平台,以提供一个实时的数据视图。2.分层架构:批处理层、实时处理层、服务层一些框架:应用举例2 批处理层1.数据不可变2.可以进行任何计算3.水平扩展——数据量大4.高延迟——根据计算量和数量不同,运行时间可能几...原创 2019-03-12 20:01:50 · 960 阅读 · 0 评论 -
《Field-aware Factorization Machines for CTR Prediction》FFM模型整理及python代码
1 原文(点击下载)2 FFM模型FFM(Field-aware Factorization Machine)最初的概念来自Yu-Chin Juan(阮毓钦,毕业于中国台湾大学,现在美国Criteo工作)与其比赛队员,是他们借鉴了来自Michael Jahrer的论文[14]中的field概念提出了FM的升级版模型。通过引入field的概念,FFM把相同性质的特征归于同一个fi...原创 2019-03-19 19:05:04 · 1438 阅读 · 0 评论 -
《Hybrid Recommender System based on Autoencoders》理解
1 原文2 原文(与1同一个模型)3 理解3.1 本文目的学习用户和物品的非线性表示,并利用辅助信息来缓解冷启动问题。在预测过程中提高精度以及模型的鲁棒性3.2 模型1、模型输入 R(UxI)+ Side information用户物品评分矩阵的某一列(item-based)或者某一行(user-based)加上辅助信息2、模型输出对R矩阵缺失值的预...原创 2019-03-06 14:20:10 · 544 阅读 · 0 评论 -
《AutoRec: Autoencoders Meet Collaborative Filtering》理解
1 论文原文2 理解2.1 本文目的通过AutoEncoder模型来预测用户-物品矩阵(评分矩阵M x N.)中缺失的评分值。2.2 模型1、模型输入item-based:每个item用各个user对它的打分作为其向量描述(user-based:每个user用该user对各个item的打分作为输入)。2、模型输出将模型对input重建后的新向量里对应位置的值认为是预测值3...原创 2019-02-26 15:32:55 · 2425 阅读 · 0 评论 -
《Restricted Boltzmann Machines for Collaborative Filtering》理解与资料整理
1 原文如下2 理解这篇文章尝试把RBM应用到协同过滤中,在netflix上的数据集做实验,RBM方法与SVD方法线性插值相结合,能提高系统性能6%左右。2.1问题描述:对电影的推荐,用户对电影集合中的某个电影进行打分,分值区间为(0, k]。基于user-based的协同过滤算法,用用户对电影的打分形成一个整数向量,用来表征用户特征,进一步计算用户之间的相似度。这篇文章...原创 2019-02-25 09:28:35 · 1744 阅读 · 0 评论 -
《Collaborative Deep Learning for Recommender Systems》整理以及未理解的部分问题(求解答)
1 原文2 整理(参考搜狐技术产品,相关资料感觉好少。。。)2.1 摘要协同过滤作为集体智慧方法的典型代表作,在推荐系统的发展过程中占据着很高的位置,其简单容易理解的特性使其成为了大多企业的首要推荐方法,也带来了很好的推荐效果。但是作为集体智慧,其发挥的场景也往往受限,例如稀疏数据下的协同过滤就往往难以发挥很好的作用;协同过滤往往只采用了ID特征(或者评分特征)对其本身的...原创 2019-02-28 09:07:06 · 1691 阅读 · 1 评论 -
Wide & Deep Learning for Recommender Systems 翻译
摘要通过将稀疏数据的非线性转化特征应用在广义线性模型中被广泛应用于大规模的回归和分类问题。通过广泛的使用交叉特征转化,使得特征交互的记忆性是有效的,并且具有可解释性,而然不得不做许多的特征工作。相对来说,通过从稀疏数据中学习低纬稠密embedding特征,并应用到深度学习中,只需要少量的特征工程就能对潜在的特征组合具有更好的范化性。 但是当用户项目交互是稀疏和高纬数据的时候,利用了embed...翻译 2019-02-22 09:10:34 · 2773 阅读 · 2 评论 -
《Neural Factorization Machines for Sparse Predictive Analytics》NFM模型及python代码
1 原文点击【原文】即可进行下载2 NFM模型在当今互联网工业界中,有许多预测任务需要用到大量的类别特征。要想将这些类别特征送入到模型中,就必须得将其onehot。但这样一来,就会产生大量的稀疏特征,要想从这些稀疏特征中充分学习到有用的信息,必须要考虑特征之间的相互作用。FM算法是一种常用的解决方案,因为它充分考虑了二阶特征之间的相互作用。然而FM有一个缺点,就是它仅仅以线性的方式组合了特...原创 2019-04-10 14:30:38 · 1117 阅读 · 1 评论 -
推荐|NE(Network Embedding)论文小览,附21篇经典论文和代码
文章转自:NE(Network Embedding)论文小览,附21篇经典论文和代码 自从word2vec横空出世,似乎一切东西都在被embedding,今天我们要关注的这个领域是Network Embedding,也就是基于一个Graph,将节点或者边投影到低维向量空间中,再用于后续的机器学习或者数据挖掘任务,对于复杂网络来说这是比较新的尝试,而且取得...转载 2019-03-28 14:17:25 · 1314 阅读 · 0 评论 -
《Collaborative Memory Network for Recommendation Systems》推荐系统之协同记忆网络CMN
论文0 摘要推荐系统在使用户在现代在线平台中使用个性化内容方面发挥着至关重要的作用。深度学习已经彻底改变了许多研究领域,并且最近对将其应用于协同过滤(CF)的兴趣激增。然而,现有方法与潜在因子模型构成了深度学习架构,忽略了一大类CF模型,邻域或基于记忆的方法。我们提出了协同存储网络(CMN),这是一种深层架构,用于统一两类CF模型,以非线性方式利用潜在因子模型的全局结构和和邻域模型局部结构...原创 2019-05-13 17:00:51 · 3649 阅读 · 0 评论 -
推荐系统 | 已看论文阶段性整理
1 FM模型y^(x):=w0+∑i=1nwixi+∑i=1n∑j=i+1n⟨vi,vj⟩xixj\hat{y}(\mathbf{x}) :=w_{0}+\sum_{i=1}^{n} w_{i} x_{i}+\sum_{i=1}^{n} \sum_{j=i+1}^{n}\left\langle\mathbf{v}_{i}, \mathbf{v}_{j}\right\rangle x_{i} x_...原创 2019-05-22 11:39:27 · 574 阅读 · 1 评论 -
知识图谱与推荐系统之《Multi-Task Feature Learning for Knowledge Graph Enhanced Recommendation》MKR
依次训练的方法主要有:Deep Knowledge-aware Network(DKN)联合训练的方法主要有:Ripple Network交替训练主要采用multi-task的思路,主要方法有:Multi-task Learning for KG enhanced Recommendation (MKR)上上一篇介绍了依次训练的DKN模型,上篇介绍了联合训练的RippleNet模型。这次介...原创 2019-05-08 22:33:53 · 8977 阅读 · 2 评论 -
《DKN: Deep Knowledge-Aware Network for News Recommendation》知识图谱与推荐系统结合之DKN
转自:https://cloud.tencent.com/developer/article/1095691【导读】传统的新闻推荐算法仅仅从语义层对新闻进行表示学习,而忽略了新闻本身包含的知识层面的信息。本文将知识图谱实体嵌入与神经网络相结合,将新闻的语义表示和知识表示融合形成新的embedding表示,以此来进行用户新闻推荐。这种方法考虑了不同层面上的信息,实验证明比传统的方法效果好。▌摘要网...转载 2019-04-29 17:10:29 · 10284 阅读 · 1 评论 -
知识图谱与推荐系统之RippleNet
上一篇介绍了依次训练的DKN模型,本文介绍连个训练的RippleNet模型。在DKN中,我们需要首先学习到entity的向量和relation的向量,但是学习到的向量,其目的是为了还原知识图谱中的三元组关系,而并非是为了我们的推荐任务而学习的。因此今天我们来介绍一下知识图谱和推荐系统进行联合训练的一种网络结构:RippleNet。论文KG-aware recommendation 可以分...原创 2019-05-02 10:01:59 · 13012 阅读 · 0 评论 -
阿里妈妈DIN模型(Deep Interest Network)
前言 阿里的商业广告CTR预测,使用了最新的Attention机制,我们来看一下是怎么用的,在相关的推荐工作中借鉴下经验。为什么用Attention 为什么要用attention? 1) 业务中的发现,用户的历史行为数据,并不都对每一次的点击做贡献,而是仅仅有一部分在起作用。这就很像attention了,告知某些点上是与当前的状态最相关的。 举个...转载 2019-04-15 08:07:18 · 6306 阅读 · 1 评论 -
推荐算法常用评价指标:NDCG、MAP、MRR、HR、ILS、ROC、AUC、F1等
1 混淆矩阵TP(true positive):表示样本的真实类别为正,最后预测得到的结果也为正;FP(false positive):表示样本的真实类别为负,最后预测得到的结果却为正;FN(false negative):表示样本的真实类别为正,最后预测得到的结果却为负;TN(true negative):表示样本的真实类别为负,最后预测得到的结果也为负.其中,TP与TN表示分类正确...原创 2019-04-21 20:57:27 · 88323 阅读 · 11 评论 -
《Learning Piece-wise Linear Models from Large Scale Data for Ad Click Prediction》阿里妈妈MLR模型与python代码
MLR 模型可以用于点击率CTR预估(二分类)。可以先看一下原文下载地址 https://arxiv.org/pdf/1704.05194.pdf 。数学模型写成了如下形式:文中,σ(x)σ(x)σ(x)采用Softmax函数,η(x)η(x)η(x)采用sigmoid函数,同时,g(x)=xg(x)=xg(x)=x,那么上式可以转换成:模型的损失函数为包含三部分:交叉熵损失,L2正则...原创 2019-04-13 19:11:14 · 876 阅读 · 0 评论 -
《Attentional Factorization Machines》AFM模型及python实现
1 原文没有仔细看,只是看了一下模型结构。点击【原文】即可下载。2 模型对于监督学习问题,类别特征作为输入,一般One-hot,所以需要引入特征交互来做出更精确的预测;但是如果直接以product的方式来显示交互,对于稀疏输入数据集,只能观察到一些交叉特征;所以FM被提出了,利用隐变量来做内积实现交互,但是FM也存在问题,也就是所有交互特征的权重是一样的;但是在实际中,应该预测性较低的特...转载 2019-04-10 08:35:31 · 1760 阅读 · 0 评论 -
《Deep & Cross Network for Ad Click Predictions》DCN模型以及python代码
论文的下载地址:https://arxiv.org/pdf/1708.05123.pdf1 DEEP & CROSS NETWORK (DCN)1.1 Embedding and Stacking Layer在进行CTR预估时,特征经过one-hot之后,输入模型的向量会变得比较稀疏,维度非常大。因此开始有人将one-hot后的向量进行embedding,将每个特征向量转换成长度相...原创 2019-04-16 14:19:04 · 1228 阅读 · 0 评论 -
【实践】信息流推荐算法实践 & 深入
0 文章转自:https://blog.csdn.net/dengxing1234/article/details/79756265 一. 背景负责信息流推荐系统后台算法的工作也有一段时间,从零开始构建推荐系统的过程中,在总结了业界一些成功的经验的同时,也摸索了一些有效的实践方法。愿在此沉淀,通过交流扩展眼界。推荐系统重在算法,这也是各大公司算法...转载 2019-04-03 11:11:38 · 805 阅读 · 0 评论 -
《Neural Collaborative Filtering》NCF模型的理解以及python代码
1 原文2 NCF模型2.1 背景在信息爆炸的时代,推荐系统在缓解信息过载方面发挥着关键作用,已被许多在线服务广泛采用,包括电子商务,在线新闻和社交媒体网站。个性化推荐系统的关键在于根据用户过去的交互(例如评级和点击)对项目的偏好建模,称为协同过滤。在各种协同过滤技术中,矩阵分解(MF)是最受欢迎的一种,其中使用潜在特征向量来表示用户或项目,将用户和项目投射到共享潜在空间...原创 2019-04-09 08:38:52 · 13420 阅读 · 6 评论 -
《Practical Lessons from Predicting Clicks on Ads at Facebook》GBDT+LR模型在CTR中的应用以及python实现
1 原文2 GBDT+LR2.1 背景CTR预估,广告点击率(Click-Through Rate Prediction)是互联网计算广告中的关键环节,预估准确性直接影响公司广告收入。CTR预估中用的最多的模型是LR,LR是广义线性模型,与传统线性模型相比,LR使用了Logit变换将函数值映射到0~1区间 ,映射后的函数值就是CTR的预估值。LR,逻辑回归模型,这种线性模...原创 2019-04-03 08:08:51 · 1104 阅读 · 0 评论 -
《xDeepFM: Combining Explicit and Implicit Feature Interactions for Recommender Systems》对xDeepFM模型的理解
如果不了解FM模型或者FFM模型或者DeepFM模型可以查阅下面三篇文章:1、推荐系统 | 《Factorization Machines》 | FM模型及python实现2、《Field-aware Factorization Machines for CTR Prediction》FFM模型整理及python代码3、《DeepFM: A Factorization-Machine bas...原创 2019-03-29 13:53:31 · 2638 阅读 · 2 评论 -
LDA模型应用、问题、评估
LDA主题模型及python实现介绍了LDA模型的基本原理与Sklearn实现流程。1 应用聚类:主题是聚类中心,文章和多个类簇(主题)关联。聚类对整理和总结文章集合很有帮助。参看Blei教授和Lafferty教授对于Science杂志的文章生成的总结。点击一个主题,看到该主题下一系列文章。特征生成:LDA可以生成特征供其他机器学习算法使用。LDA为每一篇文章推断一个主题分布;K个主...原创 2019-01-06 09:45:43 · 3056 阅读 · 1 评论 -
Surprise库 | 利用KNNBaseline实现电影推荐
import osfrom surprise import KNNBaselineimport iofrom surprise import Dataset# step 1 : train modeldef TrainModel(): data = Dataset.load_builtin('ml-100k') trainset = data.build_full_tr...原创 2018-12-30 15:10:15 · 2933 阅读 · 0 评论 -
读书笔记《推荐系统实战》| 利用社交网络数据
美国著名的第三方调查机构尼尔森调查了影响用户相信某个推荐结果的因素,90%的用户相信朋友对他们的推荐。基于社交网络的推荐可以很好的模拟现实社会。所以利用社交网络数据进行推荐可以增加用户对系统的信任度。另外利用用户在社交网络的数据可以解决冷启动问题。6.1 获取社交网络数据的途径主要方式:电子邮件(联系人);用户的注册信息(居住地和工作地);用户的位置信息(网页的IP和手机的GPS);论坛...原创 2018-10-24 08:39:34 · 647 阅读 · 0 评论 -
一文读懂推荐系统
1. 推荐系统的3个W1.1 是什么(What is it?)推荐系统就是根据用户的历史行为、社交关系、兴趣点、所处上下文环境等信息去判断用户当前需要或感兴趣的物品/服务的一类应用。1.2 为什么(Why is that?)为什么我们要用到推荐系统呢?随着信息技术和互联网的发展,人类从信息...转载 2018-10-29 15:42:25 · 1801 阅读 · 0 评论 -
今日头条推荐算法原理解析
转自:https://blog.csdn.net/ScarlettYellow/article/details/80458075?utm_source=blogxgwz2 ,谢谢原作者这么精简的总结。 Abstract:这篇是1月份头条首次公开的算法原理的笔记记录。1.头条推荐算法原理1.1 系统概览1.资讯推荐系统”你关心的,才是头条“本质要解决的问题:用户、环...转载 2018-10-29 15:37:03 · 8536 阅读 · 0 评论 -
基于内容相似度的推荐与TF-IDF算法
1 基于内容相似度的推荐注:为尊重大佬,博文第一部分来自:https://blog.csdn.net/qq_32690999/article/details/77434381 ,这篇文章一定要读一下,非常赞!1.1概念基于内容相似度的推荐就是把与你喜欢看的新闻内容相似新闻推荐给你。基于内容的推荐算法的主要优势在于无冷启动问题,只要用户产生了初始的历史数据,就可以开始进行推荐的计算。而且随着用...原创 2018-10-29 09:35:18 · 9676 阅读 · 0 评论 -
基于物品的协同过滤算法
基于物品的协同过滤,ItemCF,ItemCollaborationFilter,核心思想给用户推荐那些和他们之前喜欢的物品相似的物品。比如,用户A之前买过《数据挖掘导论》,该算法会根据此行为给你推荐《机器学习》,但是ItemCF算法并不利用物品的内容属性计算物品之间的相似度,它主要通过分析用户的行为记录计算物品之间的相似度。算法认为,物品A和物品B具有很大的相似度是因为喜欢物品A的用户大...原创 2018-10-25 20:53:40 · 12141 阅读 · 0 评论 -
读书笔记《推荐系统实战》| 评分预测问题
《推荐系统实战》这本书的下载地址:《推荐系统实战》第一章 好的推荐系统第二章 利用用户行为数据第三章 推荐系统冷启动问题第四章 利用用户标签数据第五章 利用上下文信息第六章 利用社交网络数据第七章 推荐系统前面介绍的推荐系统都是TOPN推荐问题,其实推荐系统在理论研究中比较重要的话题是评分预测问题。8.1 离线实验方法首先将给定的数据集划分为训练集和测试集,然后根据训练集建立用...原创 2018-10-25 16:21:05 · 1486 阅读 · 1 评论 -
项亮《推荐系统实战》思维导图
最近拜读了项亮博士的《推荐系统实战》,收获很大,整理了一系列的博客。将各章节的链接放在下面,欢迎查看、交流。本文主要总结了1-6章的主要思路,并思维导图绘制。《推荐系统实战》、《集体智慧编程》、思维导图第一章 好的推荐系统第二章 利用用户行为数据第三章 推荐系统冷启动问题第四章 利用用户标签数据第五章 利用上下文信息第六章 利用社交网络数据第七章 推荐系统第八章 评分预测问题第...原创 2018-10-28 16:02:04 · 3941 阅读 · 0 评论 -
智能推荐系统开发中的十大要素
**智能推荐系统充分运用了机器学习、数据挖掘、搜索引擎、自然语言处理等相关领域的技术。**但推荐系统并不神秘,事实上,推荐在我们身边无处不在。对广 大软件开发工程师们来说,能够投身于推荐系统的研发,是一件既有趣又充满挑战的工作。想要成功的开发一套效果良好的推荐系统,有一系列值得重视的关键点, 文本对此进行了总结,具体列举如下。1 充分运用显式\隐式反馈数据数据是一切推荐系统的基础。良好的推荐效...转载 2018-10-25 09:29:26 · 7341 阅读 · 0 评论