![](https://img-blog.csdnimg.cn/20201014180756927.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
数据建模标签
qq_41945142
客户画像_标签开发
展开
-
模型宽表搭建过程中遇到的问题——代码
进入画像部门之后,我前后为模型组同事拼接了20多张模型宽表,每张宽表的标签数量不等。小的在100个字段左右,取数的表二十个左右;大的超过一千个字段,取数的表超过50个。业务方一般会提供给我们一个详细开的发文档,说明各个标签的英文名,中文备注,数据类型,和取数表,有时也有可能部分标签提供逻辑需要自己开发。当我们收到开发文档后,千万不要急着去敲代码,不然你会掉进深渊,我们要做一下的工作。1...原创 2019-07-07 18:54:52 · 965 阅读 · 0 评论 -
客户画像模型宽表搭建
原创 2019-07-07 19:08:49 · 1288 阅读 · 0 评论 -
Hive中如何统计用户三个月或者以上的行为数据
客户画像中,标签开发经常会有类似下面维度的标签,那该如何处理呢?客户最近三个月点击app**模块的活跃时长 客户最近三个月点击app**模块的活跃次数 客户最近三个月点击app**模块的活跃天数常规方法,以及存在的问题最直接的办法就是在计算出当天数据之后,然后一次性加在90天的数据,goup by做相应的聚合操作,在用户量不是很大的情况下,这样做事没有问题的,但是假设一天的活跃用...原创 2019-07-06 00:16:19 · 5266 阅读 · 0 评论 -
画像标签累计类型如何计算
我们在开发画像标签的过程中会遇到如下的维度:客户首次进入app**模块的日期 客户最后一次进入app**模块的日期 客户在app**模块的累计的活跃时长 客户在app**模块的累计活跃次数 客户在app**模块的累计活跃天数核心思想是用用今天的数据和历史数据滚动式迭代的方式计算,示例代码如下:任务A存储着用户当天的数据;create table A(phone_no st...原创 2019-07-06 08:42:44 · 194 阅读 · 0 评论