推荐系统眼中的你---用户画像

最新推荐文章于 2021-12-31 16:18:16 发布

super_chiry

最新推荐文章于 2021-12-31 16:18:16 发布

阅读量252

点赞数

分类专栏：推荐系统

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/super_chiry/article/details/105566588

版权

推荐系统专栏收录该内容

6 篇文章 1 订阅

订阅专栏

用户画像

我们已经进入到互联网的下半场，增长的动力来自数据驱动。而数据分析的出发点，来自于对用户行为及需求的洞察。如何将用户标签化以便推荐系统能够推荐合适的内容给用户是用户画像的重点。

用户画像的准则
我们需要解决三个问题：

都是谁
从哪来
到哪去

Step1、统一标识：用户唯一标识是整个用户画像的核心
Step2、给用户打标签：用户标签的4个维度
Step3、基于标签指导业务：业务赋能的3个阶段

用户画像都有哪些维度
八字原则：用户消费行为分析
用户标签：性别、年龄、地域、收入、学历、职业等
消费标签：消费习惯、购买意向、是否对促销敏感
行为标签：时间段、频次、时长、收藏、点击、喜欢、评分
（User Behavior可以分成Explicit Behavior和Implicit Behavior）
内容分析：对用户平时浏览的内容进行分析，比如体育、游戏、八卦

用户标签如何指导业务
用户生命周期的三个阶段
获客：如何进行拉新，通过更精准的营销获取客户；
粘客：个性化推荐，搜索排序，场景运营等；
留客：流失率预测，分析关键节点降低流失率

标签如何产生：
典型的方式有：
PGC：专家生产
UGC：普通生产
标签是对高维事物的抽象（降维）
聚类算法：K-Means，EM聚类，Mean-Shift，DBSCAN，层次聚类

如何利用用户标签做推荐

SimpleTagBased算法
统计每个用户的常用标签
对每个标签，统计被打过这个标签次数最多的商品
对于一个用户，找到他常用的标签，然后找到具有这些标签的最热门物品推荐给他
用户u对商品i的兴趣：
$\sum_t use\_tags[u,t]*tag\_items[t,i]$

NormTagBased算法：
对score进行归一化:
$\sum_t use\_tags[u,t]/use\_tags[u]*tag\_items[t,i]/tag\_items[t]$

TagBased-TFIDF算法：
如果一个tag很热门，会导致user_tags[t]很大，所以即使tag_items[u,t]很小，也会导致score(u,i)很大。给热门标签过大的权重，不能反应用户个性化的兴趣。
这里借鉴TF-IDF的思想，使用tag_users[t]表示标签t被多少个不同的用户使用:
$\sum_t use\_tags[u,t]/log(1+use\_tags[t])*tag\_items[t,i]$

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
推荐系统眼中的你---用户画像

用户画像我们已经进入到互联网的下半场，增长的动力来自数据驱动。而数据分析的出发点，来自于对用户行为及需求的洞察。如何将用户标签化以便推荐系统能够推荐合适的内容给用户是用户画像的重点。用户画像的准则我们需要解决三个问题：都是谁从哪来到哪去Step1、统一标识：用户唯一标识是整个用户画像的核心Step2、给用户打标签：用户标签的4个维度Step3、基于标签指导业务：业务赋能的3个...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。