推荐系统
文章平均质量分 63
suibianshen2012
这个作者很懒,什么都没留下…
展开
-
搜索推荐中的 Position Bias
在搜索推荐系统中,Bias可以说无处不在。之前我们整理过搜索、推荐、广告中的曝光偏差问题,今天来看看 position bias。1. 什么是position biasPosition-Bias是指 item 在展示页面的排序位置,及其相对广告的位置等。经验和有关论文都告诉我们,这种位置会影响item的点击率。这种影响跟用户的「真实兴趣」无关,而是跟用户的注意力、用户对广告的情绪有关。例如有眼动实验表示用户会很少关注那些在列表靠下的item。离线分析显示,排在前面的文章一般比排在后面的文章点击率高原创 2022-03-28 16:11:09 · 391 阅读 · 0 评论 -
MMOE核心代码块
class MMoE_Layer(tf.keras.layers.Layer): def __init__(self,expert_dim,n_expert,n_task): super(MMoE_Layer, self).__init__() self.n_task = n_task self.expert_layer = [Dense(expert_dim,activation = 'relu') for i in range(n_expert).原创 2022-03-28 15:13:56 · 689 阅读 · 0 评论 -
self-attention为什么要除以根号d_k
一、因为softmax的输入很大时,其梯度会变的很小,趋近于0;二、除以根号Dk的目的就是使得,QK/Dk满足方差稳定到1,使得softmax的梯度不至于太小原创 2021-12-25 11:53:01 · 14287 阅读 · 3 评论 -
推荐系统漫谈之流行度偏置(popularity bias)与数据链路(Feedback Loop)
推荐系统存在 popularity bias,即少部分物品被频繁曝光。系统记录下频繁曝光的日志,并基于日志数据制定推荐策略,这种反馈链路(Feedback Loop)进一步放大推荐系统的popularity bias,从而对推荐多样性、挖掘用户真实兴趣、用户体验等有着不利影响。引起popularity bias问题的原因可能有以下两个方面:1、数据bias:数据本身就存在严重bias,头部物品占了绝大多数曝光。2、算法bias:算法把头部物品频繁推荐给用户,使得数据bias进一步放大。动态来看,原创 2021-03-10 19:35:10 · 1155 阅读 · 0 评论 -
近似最近邻算法查找(ann)--01
Ann, Approximate Nearest Neighbor的缩写,就是近似最近邻搜索。在机器学习领域,语义检索,图像识别,推荐系统等方向常涉及到的一个问题是:给定一个向量X=[x1,x2,x3...xn],需要从海量的向量库中找到最相似的前K个向量。通常这些向量的维度很高,对于在线服务,用传统的方法查找是非常耗时的,容易使得时延上成为瓶颈,因此业界通用的方式就是将最相似的查找转换成An...转载 2019-09-27 10:50:00 · 4225 阅读 · 0 评论 -
实时推荐系统简要概述
推荐系统介绍自从1992年施乐的科学家为了解决信息负载的问题,第一次提出协同过滤算法,个性化推荐已经经过了二十几年的发展。1998年,林登和他的同事申请了“item-to-item”协同过滤技术的专利,经过多年的实践,亚马逊宣称销售的推荐占比可以占到整个销售GMV(Gross Merchandise Volume,即年度成交总额)的30%以上。随后Netflix举办的推荐算法优化竞赛,吸引转载 2016-04-28 15:38:00 · 914 阅读 · 0 评论 -
基于用户的协同过滤推荐算法原理和实现
在推荐系统众多方法中,基于用户的协同过滤推荐算法是最早诞生的,原理也较为简单。该算法1992年提出并用于邮件过滤系统,两年后1994年被 GroupLens 用于新闻过滤。一直到2000年,该算法都是推荐系统领域最著名的算法。 本文简单介绍基于用户的协同过滤算法思想以及原理,最后基于该算法实现园友的推荐,即根据你关注的人,为你推荐博客园中其他你有可能感兴趣的人。基本思想转载 2016-06-05 22:56:28 · 1001 阅读 · 0 评论 -
推荐系统解决冷启动问题策略
作者:刘彦彬链接:http://www.zhihu.com/question/19843390/answer/40454433来源:知乎著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。推荐系统冷启动在不同的产品,不同的应用场景会有不同的做法,通用的做法其他的知友都已经有说明,即通过不同的维度获取用户的基本特征,操作习惯,从而进行粗粒度的推荐,但确实说起来转载 2016-06-21 21:20:32 · 2994 阅读 · 0 评论 -
基于用户的协同过滤和基于物品的协同过滤推荐算法原理和实现
在现今的推荐技术和算法中,最被大家广泛认可和采用的就是基于协同过滤的推荐方法。本文将带你深入了解协同过滤的秘密。下面直接进入正题1 什么是协同过滤协同过滤是利用集体智慧的一个典型方法。要理解什么是协同过滤 (Collaborative Filtering, 简称 CF),首先想一个简单的问题,如果你现在想看个电影,但你不知道具体看哪部,你会怎么做?大部分的人会问问周围的朋友,看看最转载 2016-06-21 20:56:09 · 5928 阅读 · 0 评论 -
协同过滤推荐算法的原理及实现
协同过滤推荐算法是诞生最早,并且较为著名的推荐算法。主要的功能是预测和推荐。算法通过对用户历史行为数据的挖掘发现用户的偏好,基于不同的偏好对用户进行群组划分并推荐品味相似的商品。协同过滤推荐算法分为两类,分别是基于用户的协同过滤算法(user-based collaboratIve filtering),和基于物品的协同过滤算法(item-based collaborative filtering转载 2016-06-06 15:49:01 · 1547 阅读 · 0 评论 -
推荐系统算法简单总结
1、协同过滤和基于内容推荐有什么区别?用户u1喜欢的电影是A,B,C用户u2喜欢的电影是A, C, E, F用户u3喜欢的电影是B,D我们需要解决的问题是:决定对u1是不是应该推荐F这部电影基于内容的做法:要分析F的特征和u1所喜欢的A、B、C的特征,需要知道的信息是A(战争片),B(战争片),C(剧情片),如果F(战争片),那么F很大程度上可以推荐给u1,这是基于内容的做法,转载 2016-08-29 21:04:15 · 614 阅读 · 0 评论 -
基于内容的推荐系统
Collaborative Filtering Recommendations (协同过滤,简称CF) 是目前最流行的推荐方法,在研究界和工业界得到大量使用。但是,工业界真正使用的系统一般都不会只有CF推荐算法,Content-based Recommendations (CB) 基本也会是其中的一部分。 CB应该算是最早被使用的推荐方法吧,它根据用户过去喜欢的产品(本文统称为转载 2016-08-29 21:36:01 · 3103 阅读 · 0 评论 -
推荐系统:基于用户和基于物品的协同过滤算法的比较
首先回顾一下,协同过滤算法主要有两种,一种是基于用户的协同过滤算法(UserCF),另一种是基于物品的协同过滤算法(ItemCF)。基于用户的协同过滤算法主要有两步:1)找到和目标用户兴趣相似的用户集合 2)找到这个集合中的用户喜欢的,且目标用户没有听说过的物品推荐给目标用户。基于物品的协同过滤算法主要有两步:1)计算物品之间的相似度。转载 2016-08-25 17:02:03 · 5078 阅读 · 0 评论 -
推荐系统:协同过滤算法简介
“探索推荐引擎内部的秘密”系列将带领读者从浅入深的学习探索推荐引擎的机制,实现方法,其中还涉及一些基本的优化方法,例如聚类和分类的应用。同时在理论讲解的基础上,还会结合 Apache Mahout 介绍如何在大规模数据上实现各种推荐策略,进行策略优化,构建高效的推荐引擎的方法。本文作为这个系列的第一篇文章,将深入介绍推荐引擎的工作原理,和其中涉及的各种推荐机制,以及它们各自的优缺点和适用场景,帮助转载 2016-04-28 15:13:35 · 4419 阅读 · 0 评论