![](https://img-blog.csdnimg.cn/20201014180756754.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
偏好
文章平均质量分 68
ccstargazing
这个作者很懒,什么都没留下…
展开
-
浅谈离线用户画像开发
用户画像一般包含三种画像:基础画像(base_info_da)、行为画像(action_info_da)、偏好画像(prefer_info_da)。基础画像:用户的年龄、性别、婚姻状态,还有挖掘类标签也可融入其中,如用户生命周期、留存率、流失率等。 行为画像:比如用户近X天在Y维度下访问、关注商品的次数。(X可以是1、3、7、100天,Y可以是比如裤子类、羽绒服类、夹克类) 偏好画像:根据用户X的行为数据,进行时间衰减和不同行为的权重计算出偏好。(比如裤子类中,用户对休闲裤的偏好是0.6,牛仔裤的偏原创 2021-02-03 11:12:01 · 383 阅读 · 0 评论 -
偏好配置化spark参数设置
背景:偏好种类过多,每次创建、完善画像hql工作量巨大。为了解决此问题,将hql配置化生成,并且使用spark运行。由于不同的偏好量不同,脚本动态分配资源,直接上代码!脚本:sh /....../prefer_res_normal.sh 参数1 参数2 21840 (21840约等于偏好M数,必须为840的倍数)#!/bin/bashpartitions=`expr ${3} / 140`numexe=`expr ${3} / 840`--master yarn \--driver原创 2020-10-23 21:03:23 · 501 阅读 · 0 评论