用户画像
文章平均质量分 90
MusicDancing
这个作者很懒,什么都没留下…
展开
-
标签预测那些事
标签预测模型思路:1. 问题描述通过老用户的静态特征(手机品牌、性别、地域、安装的APP列表),以及用户的兴趣标签tag分数,构造模型预测新用户的兴趣标签tag。2. 特征说明及预处理1. 手机品牌组原始手机品牌非常杂乱,包括各大厂商的子品牌,共计6W个。取京东上有售的118个手机品牌,从0-118进行编号,其中0为缺省值。这部分作为一个特征。2. 地域组一共237个地区(包括国外地区),由于国外地区人数分布比较多,将其保留,并从0-237进行编号,其中0为缺省值。这原创 2022-01-28 21:48:29 · 2444 阅读 · 0 评论 -
业界Embedding方法调研
1. YouTube全连接模型,最上层的Relu输出为k维用户向量,然后经过 k*M 矩阵,映射为M维向量(与之对应,item共有M个),再经过softmax与用户点击过的视频拟合。其中 k*M 为item向量,每个item向量为k维。2. 新浪FM模型,特征分为3类:1. 用户特征;2. item特征;3. 上下文特征;模型训练...原创 2022-01-28 16:34:46 · 1425 阅读 · 0 评论 -
用户画像TGI
参考:用户画像TGI在用户画像的评判和验证中,TGI(Target Group Index)是一个很重要的指标。1. TGI概念TGI=[目标群体中具有某一特征的群体所占比例/总体中具有相同特征的群体所占比例]*标准数100。TGI指数等于100表示平均水平,高于100代表该类用户对某类特征的关注程度高于整体水平。举个简单例子,比如某客户端所有用户的男女比是60%和40%,在这些用户中,看过某体育视频的男女比是90%和10%,看过某母婴视频的男女比是20%和80%。那么该体育视频在男性中的T原创 2021-08-06 18:53:54 · 981 阅读 · 0 评论