![](https://img-blog.csdnimg.cn/20201014180756927.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
推荐系统
文章平均质量分 73
JL_Jessie
这个作者很懒,什么都没留下…
展开
-
推荐系统中 纯用户冷启动问题研究
纯冷启动问题Pure cold star problem区别于一般冷启动cold star的一点是无法从第三方获取任何有关用户的信息,即它指的是推荐系统(RS)的功能,可为没有历史数据的用户提供有用的推荐。作者基于用户覆盖率最大化引入了两个新的RS来缓解此问题:Max-Coverage 和 Category-Exploration。这项工作旨在增强向初次用户发布的推荐,从而缓解纯冷启动问题。系统做出的假设:因受欢迎程度,新近度和正面评分而产生偏差的商品有可能满足大多数首次使用者的兴趣,但并非总是如此。原创 2022-08-21 17:45:08 · 697 阅读 · 1 评论 -
NRMS: Neural News Recommendation with Multi-Head Self-Attention
NRMSMSRA 2019年的多头注意力机制的神经网络推荐算法这里做个简单的总结原创 2021-05-10 09:47:04 · 2054 阅读 · 0 评论 -
推荐系统有关博客文章
简单汇总一下,方便后面查看【基础】推荐系统教程推荐系统学习清单推荐系统/计算广告/机器学习/CTR预估资料汇总排序学习杂谈-上 排序学习杂谈-下推荐系统随笔推荐系统中的排序学习推荐系统技术演进趋势:从召回到排序再到重排deeplearning 用来做推荐系统基于矩阵分解的推荐算法基于协同过滤的推荐算法文本内容分析算法DPP行列式点阵在推荐系统中的应用【各大公司应用】得物推荐系统Transformer 在美团搜索排序中的实践Embedding在大厂的应用推荐系统Embed原创 2021-04-06 15:38:37 · 208 阅读 · 0 评论 -
推荐系统中的排序概述
推荐系统中的排序学习1.为什么需要排序学习1.1 排序学习在推荐领域的重要作用2.排序学习框架2.1.基本流程2.2.特征提取2.3.标签获取2.3.1人工标注2.3.2 日志抽取3.排序学习设计方法3.1.单点法(Pointwise)推荐领域的 Pointwise 排序学习3.2 配对法(Pairwise)Pointwise与Pairwise的结合方案3.3 列表法(Listwise)排序学习(Learning to Rank,LTR),也称机器排序学习(Machine-learned Ranking,原创 2021-03-16 21:43:13 · 1916 阅读 · 1 评论 -
排序算法 LTR 的评价指标
排序算法评价指标排序指标1.1 MRR1.2 MAP1.3 NDCG1.4 ERR最近想要总结一下 LTR的算法,虽然DL的出现已经可以快速替代了LTR的方法,但是工业界还有很多LTR的应用。先讲解LTR的评价指标排序指标信息检索和推荐系统常用排序质量评分有4种:MRR(Mean Reciprocal Rank):平均倒数排名。 通用的对搜索推荐算法进行评价的机制,即第一个结果匹配,分数为1,第二个匹配分数为0.5,第n个匹配分数为1/n,如果没有匹配的句子分数为0。最终的分数为所有得分之和。原创 2021-03-13 17:25:41 · 1545 阅读 · 2 评论 -
大数据的技术生态,Hadoop,Hive,Spark之间的关系
这个内容摘抄自知乎一个问题的答案,希望可以把大数据生态圈的技术理清楚。大数据技术本质上无非4个核心问题:存储:海量的数据怎么有效存储?主要包括 HDFS, Kafka;计算:海量的数据怎么快速计算?主要包括:MapReduce,Spark,Flink等;查询:海量的数据怎样快速查询?主要包括Nosql和Olap,Nosql包括Hbase\Cassandra等,其中olap包括kylin,impla等,其中Nosql主要解决随机查询、Olap技术主要解决关联查询。挖掘:海量数据怎样挖掘出隐藏的知识原创 2020-12-28 12:09:36 · 671 阅读 · 0 评论 -
推荐系统的论文阅读更新计划
基于Embedding+MLP的结构DeepCrossing : 基于Embedding+MLP+Resnet的经典DNN结构PNN: DeepCrossing + Product层对协同过滤的改进模型NeuralCF: 将神经网络替代协同过滤中的点积操作将因子分解机的隐向量作为Embedding初始化值FNN (基于FM)基于Wide&Deep结构的Wide&Deep对wide部分进行改进的Deep&Cross: 将wide部分替换成Cross原创 2020-12-21 12:14:04 · 131 阅读 · 0 评论 -
推荐系统--n--模型DeepFM
前面提到了Embedding+MLP(DeepCrossing/PNN), Wide&Deep, NerualCF(单塔/双塔)等不同的模型结构,那我们再深入思考一个问题:就是这几种模型都是怎么处理特征交叉的?比如说,模型的输入有 性别、年龄、电影风格这几个特征,在训练样本中,我们发现25岁男生喜欢科幻电影的样本,有35岁女生喜欢恐怖电影的样本,那你觉得模型应该怎么推测“25岁”女生喜欢的电影风格呢?事实上,这类特征组合和特征交叉问题非常常见,实际应用中,特征的种类还要多得多,特征交叉的复杂程度原创 2020-12-21 12:04:05 · 297 阅读 · 0 评论 -
推荐系统--n--模型NeuralCF
NeuralCF是对协同过滤的改进。原创 2020-12-21 10:47:24 · 699 阅读 · 0 评论 -
推荐系统--n--模型Wide&Deep
Wide&Deep 让你的模型既有想象力又有记忆力。Google的Wide&Deep在工业界有着巨大的影响力。只要掌握wide&deep就抓住了深度推荐模型这几年发展的一个主方向。Wide&Deep 形象化理解“宽且深”,我们之前的Embedding+MLP经典结构,因为MLP可以有多层神经网络,所以它是一个比较“深”的模型,但是Wide&Deep这个模型的“深”与MLP有什么区别吗?“宽”的部分又是怎样的呢?宽和深分别有什么不同的作用呢?以及为什么要把他们结合在原创 2020-12-21 00:14:12 · 232 阅读 · 0 评论 -
推荐系统--n--模型DeepCrossing和PNN
微软2016年提出的DeepCrossing 是经典的Embedding+MLP结构。Embedding + MLP 模型结构微软把DeepCrossing用于广告推荐这个业务场景上。DeepCrossing从下到上可以分为5层,分别是Feature层、Embedding层、Stacking层、MLP层和Scoring层。Feature层feature 层也叫输入特征层,它处于DeepCrossing的最底部,作为整个模型的输入。但是仔细观察feature层,我们会发现不同的特征在细节上的一些区别原创 2020-12-20 23:29:33 · 246 阅读 · 0 评论 -
推荐系统--3--深度学习发展
深度学习推荐模型,有早期微软的DeepCrossing, Google的Wide&Deep,阿里的MLR,到现在影响力非常大的DIN, DIEN, YouTube的深度推荐模型等。这篇文章讲的是深度学习推荐模型,以及他们之间的发展关系。深度学习能够显著提升推荐系统的效果,主要原因在于2点:深度学习极大地增强了推荐模型的拟合能力深度学习模型可以利用模型结构模拟用户兴趣的变迁、用户注意力机制等不同的用户行为过程。深度学习模型的强拟合能力经典的推荐算法,矩阵分解,在矩阵分解模型的结构中,用原创 2020-12-20 23:01:28 · 549 阅读 · 1 评论 -
推荐系统--2--协同过滤与矩阵分解
协同过滤与矩阵分解协同过滤算法的基本原理计算用户相似度用户评分的预测矩阵分解算法总结这里主要介绍几个推荐系统的模型。推荐系统模型是最重要的一块,因为推荐模型直接决定了最终物品排序的结果,它的好坏也直接影响着推荐效果的优劣。而且从某种意义上讲,推荐系统的整体架构都是围绕着推荐模型搭建的,用于支持推荐模型的上线、训练、评估、服务。这里讲解的是 最经典的”协同过滤“。协同过滤算法的基本原理我们知道”用户行为数据是推荐系统最常用,也是最关键的数据。用户的潜在兴趣、用户对物品的评价好坏都反应在用户的行为历史原创 2020-12-20 20:08:05 · 3892 阅读 · 0 评论 -
推荐系统--n--召回层
这里主要介绍召回层的技术,包括2个方面,一是召回的策略,另外一个是查找近似向量的策略。召回策略单策略召回:单一无法满足用户潜在多兴趣需求多路召回:可以全面地照顾到不同的召回方法,各个策略之间的数据和信息是割裂的,无法综合考虑多个策略对同一个物品的影响基于embedding召回:既考虑到了多路召回策略,又有评分连续性的特点,embedding线上相似度计算也比较简单。召回层邻近检索方法聚类k-means:虽然可以根据k个中心 进行缩小搜索范围,但是k是超参数,不好确定,并且无法处理边原创 2020-12-20 12:16:51 · 1243 阅读 · 1 评论 -
推荐系统系列--4-- Embedding在推荐系统中的应用
自从深度学习流行起来,embedding就成为深度学习推荐系统方向最火热的话题之一。什么是Embedding?简单来说Embedding就是用一个数值向量“表示”一个对象的方法,这里的对象可以是一个词、物品、也可以是一部电影等。但是“表示”这个词怎么理解呢?用一个向量表示一个物品,一个物品能被向量表示,是因为这个向量跟其他物品向量之间的距离反应了这个物品的相似性,也就是两个向量间的距离向量甚至能够反应他们之间的关系。在Netflix应用的电影Embedding向量方法,就是一个非常直接的推荐系统的应用原创 2020-12-19 21:28:22 · 998 阅读 · 2 评论 -
矩阵分解背后数学原理
面试时遇到这个问题,试图解释SVD,PCA等方法,总感觉没有很好地解释问题。矩阵分解是机器学习常用的处理方法,包括PCA降维,协同过滤里面的分解MF等。这里简单总结一下SVD, PCA, MF有关矩阵分解的问题。矩阵分解先看一下特征值分解:设A为n*n的方阵,则 Ax=λ∗xAx = \lambda*xAx=λ∗x, 称λ\lambdaλ为方阵A的特征值,x为方阵A的特征向量。 特征值不是唯一的, 一个满秩方阵就有n个特征值,每个特征值对应一个特征向量,满秩方阵的特征向量也是线性无关的。如果A 是原创 2020-12-19 17:07:09 · 575 阅读 · 1 评论 -
推荐系统--n--特征处理2
Spark是一个分布式计算平台,所谓的分布式,指的是计算节点之间不共享内存,需要通过网络通信的方式交换数据。Spark最典型的应用方式就是建立在大良廉价的计算节点上,这些节点可以是廉价主机,也可以是虚拟的docker container.从下面的Spark架构图中我们可以看到Spark程序是由Manager node(管理节点)进行调度组织,由worker node(工作节点)进行具体的计算任务执行,最终将结果返回给Drive Program(驱动程序)。在物理的worker node上,数据还会分为不同原创 2020-12-19 10:34:33 · 251 阅读 · 1 评论 -
推荐系统--n--特征工程
推荐系统中可用的特征非常多,但它们基本上可被划分到“用户行为”“用户关系”“属性标签”“内容数据”“场景信息”这五个类别,而且挑选特征的方法也遵循着“保留有用信息,摒弃冗余信息”的原则。用户行为数据: 一般与业务相关,显示行为(评分,点赞,收藏,转发),隐式行为(点击,收藏,评论,播放,播放时长,加入购物车,购买)用户关系数据:强关系(好友关系等,关注),弱关系(同一个国家,城市,小区,同看一部电影,互相点赞等)属性标签数据:用户属性标签,物品属性标签。(类别型,来源型)(用户类标签:年龄,性别,住原创 2020-12-18 22:39:34 · 227 阅读 · 1 评论 -
推荐系统系列--1--系统架构
最近开始学习推荐系统, 在这里做个记录, 会更新如下内容:推荐系统架构推荐系统进化之路推荐系统与深度学习Embedding在推荐系统中的应用多角度审视推荐系统推荐系统工程实现推荐系统评估推荐系统前沿该系列内容是参考 王喆的深度学习推荐系统 整理的,作为自己的学习笔记.推荐系统的目的是在特定场景下...原创 2020-12-18 20:06:18 · 267 阅读 · 1 评论