用户画像和个性化推荐
文章平均质量分 89
mishidemudong
菜鸟上路,一颗红心,两手准备。
展开
-
SIGIR‘21|SGL基于图自监督学习的推荐系统
本篇文章主要介绍王翔、何向南老师团队在SIGIR2021上发表的文章SGL,Self-supervised Graph Learning for Recommendation[1]。这篇文章提出了一种应用于用户-物品二分图推荐系统的图自监督学习框架。核心的思想是,对输入的二分图,做结点和边的dropout进行数据增强,增强后的图可以看做原始图的子视图;在子视图上使用任意的图卷积神经网络,如LightGCN[2]来提取结点的表征,对于同一个结点,多个视图就能形成多种表征;然后借鉴对比学习[5]的思路,构造自监转载 2021-10-09 17:02:34 · 1712 阅读 · 0 评论 -
pyspark+DSSM做大规模道具商品个性化推荐模型训练
背景:需要从大量道具中检索出用户喜欢的道具,出于隐私保护代码中隐去了使用到的具体特征,整个流程是可以跑通的,实际使用时可以根据需要增加相应的early stopping,BN,数据采样等操作。环境设置:deepmatch==0.1.3,deepctr[GPU]==0.7.5,pyspark==2.4.0,keras模型文件: import pandas as pd import numpy as np import tensorflow as tf from ten...转载 2021-05-25 10:57:36 · 793 阅读 · 0 评论 -
论文阅读 KGAT: Knowledge Graph Attention Network for Recommendation
在这里插入图片描述1. Motivation如何将side information和用户-物品二部图考虑在一起给用户提供准确、多样和可解释的推荐是非常有必要的。目前基于CF的方法并不能很好的对用户和物品的side information进行建模,这样就不可避免的面临数据稀疏性的问题。工业界的解决办法是使用监督学习模型,比如FM,NFM,wide&deep等方法去将用户物品的所有sid...转载 2020-02-25 18:57:56 · 1722 阅读 · 0 评论 -
论文细细品读----KGAT : Knowledge Graph Attention Network for Recommendation
0 ABSTRACT在推荐系统领域中,为了使推荐结果更加准确、可解释性更高,不仅要考虑user-item之间的关系,引入外部知识丰富user-item之间的信息也非常有必要。在这方面比较常用的方法主要有FM算法(factorization machine,因子分解机),该方法主要问题在于将user-item作为相互独立的实例,忽视了item之间可能存在的相互作用关系。本文提出了一种基于知识...转载 2020-02-25 18:52:55 · 6209 阅读 · 4 评论 -
#####好好好好######如何将知识图谱特征学习应用到推荐系统?
将知识图谱作为辅助信息引入到推荐系统中可以有效地解决传统推荐系统存在的稀疏性和冷启动问题,近几年有很多研究人员在做相关的工作。目前,将知识图谱特征学习应用到推荐系统中主要通过三种方式——依次学习、联合学习、以及交替学习。 依次学习(one-by-one learning)。首先使用知识图谱特征学习得到实体向量和关系向量,然后将这些低维向量引入推荐系统,学习得到用户向量和物品向量;...转载 2020-02-25 16:51:54 · 577 阅读 · 0 评论 -
美团“猜你喜欢”深度学习排序模型实践
一. 引言推荐作为解决信息过载和挖掘用户潜在需求的技术手段,在美团点评这样业务丰富的生活服务电子商务平台,发挥着重要的作用。在美团App里,首页的“猜你喜欢”、运营区、酒店旅游推荐等重要的业务场景,都是推荐的用武之地。 图1 美团首页“猜你喜欢”场景 目前,深度学习模型凭借其强大的表达能力和灵活的网络结构在诸多领域取得了重大突破,美团平台拥有海量的用户与商家数据,以及丰富的产品使用场景,也为深度学...转载 2018-03-30 11:14:39 · 970 阅读 · 0 评论 -
互联网广告综述之点击率特征工程
互联网广告综述之点击率特征工程一.互联网广告特征工程博文《互联网广告综述之点击率系统》论述了互联网广告的点击率系统,可以看到,其中的logistic regression模型是比较简单而且实用的,其训练方法虽然有多种,但目标是一致的,训练结果对效果的影响是比较大,但是训练方法本身,对效果的影响却不是决定性的,因为训练的是每个特征的权重,权重细微的差别不会引起ctr的巨大转载 2017-12-14 10:05:19 · 296 阅读 · 0 评论 -
#####带时间衰减因子#####应用实战: 如何利用Spark集群计算物品相似度
本文是Spark调研笔记的最后一篇,以代码实例说明如何借助Spark平台高效地实现推荐系统CF算法中的物品相似度计算。在推荐系统中,最经典的推荐算法无疑是协同过滤(Collaborative Filtering, CF),而item-cf又是CF算法中一个实现简单且效果不错的算法。在item-cf算法中,最关键的步骤是计算物品之间的相似度。本文以代码实例来说明如何利用Spark平台转载 2017-12-11 11:15:27 · 2501 阅读 · 0 评论 -
SparkMLlib---基于余弦相似度的用户相似计算
package mllibimport org.apache.log4j.{Level, Logger}import org.apache.spark.{SparkContext, SparkConf}import scala.collection.mutable.Map/** * Created by 汪本成 on 2016/8/4. */object UserSimilar转载 2017-12-11 11:12:17 · 1850 阅读 · 0 评论 -
基于spark机器学习--物品推荐 物品推荐
基于spark机器学习---------物品推荐物品推荐[html] view plain copyimport org.apache.spark.SparkContext import org.apache.spark.mllib.recommendation.{ALS, Rating} import org.jblas.D转载 2017-12-11 10:06:47 · 898 阅读 · 0 评论 -
#########什么是用户画像?金融行业大数据用户画像实践#####好文章
文|鲍忠铁(微信号:daxiakanke),TalkingData首席金融行业布道师,上海大数据产业联盟金融行业专家,金融行业大数据实践推动者。鲍忠铁同时也是36大数据的专栏作者。进入 鲍忠铁 先生在36大数据的专栏>>>进入移动互联网时代之后,金融业务地域限制被打破。金融企业没有固定业务区域,金融服务面对所有用户是平的。金融消费者逐渐年轻化,80、90后成为客户主力,他们的消费意识和金融转载 2017-06-06 15:23:44 · 1331 阅读 · 0 评论 -
如何实现基于内容和用户画像的个性化推荐
基于内容和用户画像的个性化推荐,有两个实体:内容和用户。需要有一个联系这两者的东西,即为标签。内容转换为标签即为内容特征化,用户则称为用户特征化。因此,对于此种推荐,主要分为以下几个关键部分:标签库内容特征化用户特征化隐语义推荐综合上面讲述的各个部分即可实现一个基于内容和用户画像的个性化推荐系统。如下图所示:标签库标签是联系用转载 2016-11-29 11:28:22 · 7482 阅读 · 0 评论 -
用户画像数据建模方法
从1991年Tim Berners-Lee发明了万维网(World Wide Web)开始,到20年后2011年,互联网真正走向了一个新的里程碑,进入了“大数据时代”。经历了12、13两年热炒之后,人们逐渐冷静下来,更加聚焦于如何利用大数据挖掘潜在的商业价值,如何在企业中实实在在的应用大数据技术。伴随着大数据应用的讨论、创新,个性化技术成为了一个重要落地点。相比传统的线下会员管理、问卷调查、购物篮转载 2016-11-16 17:12:08 · 1250 阅读 · 0 评论 -
如何实现基于内容和用户画像的个性化推荐
个性化推荐系统是一门由数据挖掘和机器学习综合的学科,它必须能够基于用户之前的口味和喜好提供相关的精确的推荐,而且这种口味和喜欢的收集必须尽量少的需要用户的劳动。本文主要介绍了如何基于内容和用呢画像实现一个个性化推荐化系统。作者:飒然Hang来源:后端技术杂谈|2016-04-08 11:39 收藏 分享网+线下沙龙 | 移动APP模式创新:给你一个转载 2016-11-16 17:04:03 · 2559 阅读 · 0 评论 -
用户画像感性认识一
什么是用户画像?简而言之,用户画像是根据用户社会属性、生活习惯和消费行为等信息而抽象出的一个标签化的用户模型。构建用户画像的核心工作即是给用户贴“标签”,而标签是通过对用户信息分析而来的高度精炼的特征标识。举例来说,如果你经常购买一些玩偶玩具,那么电商网站即可根据玩具购买的情况替你打上标签“有孩子”,甚至还可以判断出你孩子大概的年龄,贴上“有5-10岁的孩子”这样更为具体的标签,而这些转载 2016-11-16 17:07:18 · 4848 阅读 · 0 评论 -
推荐系统之协同过滤实现
推荐系统的评测指标为了评估推荐算法的好坏需要各方面的评估指标。准确率准确率就是最终的推荐列表中有多少是推荐对了的。召回率召回率就是推荐对了的占全集的多少。下图直观地描述了准确率和召回率的含义覆盖率覆盖率表示推荐的物品占了物品全集空间的多大比例。新颖度新颖度是为了推荐长尾区间的物品。用推荐列表中物品的平均流行度度量推荐结果的新颖度。转载 2015-08-04 22:33:28 · 1646 阅读 · 0 评论 -
阿里推荐大赛:ODPS SQL 构建离线评估
上一篇文章介绍了 ODPS SQL 的大概使用方法,几个 tips,和讲到一半的离线评估。现在上来把上次的坑填完。希望对于还没有开始离线调优的团队有点帮助。划分训练集、验证集回顾训练集、验证集的划分。根据时间,可以将前三月划分为训练集:create table train_set asselect * from t_alibaba_bigdata转载 2015-08-04 22:41:39 · 692 阅读 · 0 评论 -
阿里推荐大赛:ODPS SQL 入门
第二季才是真正的开始,第一季的汗水、喜悦、纷争都通通过去了。第二季绝对是拼算法、拼模型、拼平台熟练度的比赛,相信坚持下来的话肯定收获颇丰。昨天也迫不及待地进入 「天池」 ,居然是 Windows 系统,一点都提升不了逼格啊。看文档的过程中,又是 ODPS SQL、MapReduce、XLab/XLib、Tunnel、ODPS SDK什么的,相信很多人都跟我一样看的眼花,茫然不知所措,更别提对 MR转载 2015-08-04 22:37:45 · 4267 阅读 · 0 评论 -
Slope one推荐算法原理
推荐算法Slope one的原理Slope One的基本概念很简单, 例子1, 用户X, Y和A都对Item1打了分. 同时用户X,Y还对Item2打了分, 用户A对Item2可能会打多少分呢?UserRating to Item 1Rating to Item 2X53Y43A4?根据原创 2015-08-28 14:58:13 · 4219 阅读 · 0 评论