2021.5.16数仓之用户画像表模型设计

本文介绍了如何设计数仓中的用户画像表模型,以统计当天7日活跃用户。首先分析数据来源,包括用户基本信息和每日登陆情况。接着在ODS层和EDS层设计全量和增量导入的表结构。最后,通过数据处理和分析,从用户登录表中获取不重复的活跃用户,并计算7日连续活跃用户。
摘要由CSDN通过智能技术生成

第三个业务:用户画像 - 统计当天7日活跃用户

业务分析:

要统计7日活跃用户情况需要找到
用户基本信息 & 用户每日登陆情况

用户基本信息来源:
1.支付宝注册用户
2.微信注册用户
3.qq注册用户
4.App注册用户 - 使用app注册点歌充值消费

这4类注册信息在ycak业务库,对应的4类注册用户分别在以下表中,以及表中的字段:

user_alipay_baseinfo

DROP TABLE IF EXISTS `user_alipay_baseinfo`;
CREATE TABLE `user_alipay_baseinfo` (
  `uid` int(100) NOT NULL COMMENT '用户ID',
  `reg_mid` int(100) DEFAULT NULL COMMENT '注册机器ID',
  `sex` varchar(100) DEFAULT NULL COMMENT '性别',
  `birthday` varchar(100) DEFAULT NULL COMMENT '生日',
  `msisdn` varchar(100) DEFAULT NULL COMMENT '手机号码',
  `locationid` int(100) DEFAULT NULL COMMENT '地区ID',
  `mode_type` int(100) DEFAULT NULL COMMENT '注册登录模式',
  `regist_time` varchar(100) DEFAULT NULL COMMENT '注册时间',
  `user_exp` varchar(100) DEFAULT NULL COMMENT '用户当前经验值',
  `score` int(100) DEFAULT NULL COMMENT '累计积分',
  `user_level` int(100) DEFAULT NULL COMMENT '用户等级',
  `user_type` varchar(100) DEFAULT NULL COMMENT '用户类型',
  `is_certified` varchar(100) DEFAULT NULL COMMENT '实名认证',
  `is_student_certified` varchar(100) DEFAULT NULL COMMENT '是否学生',
  `openid` varchar(100) DEFAULT NULL COMMENT '支付宝ID',
  PRIMARY KEY (`uid`)
) ENGINE=MyISAM DEFAULT CHARSET=utf8;

user_wechat_baseinfo

DROP TABLE IF EXISTS `user_wechat_baseinfo`;
CREATE TABLE `user_wechat_baseinfo` (
  `uid` int(100) NOT NULL COMMENT '用户ID',
  `reg_mid` int(100) DEFAULT NULL COMMENT '注册机器ID',
  `sex` varchar(100) DEFAULT NULL COMMENT '性别',
  `birthday` varchar(100) DEFAULT NULL COMMENT '生日',
  `msisdn` varchar(100) DEFAULT NULL COMMENT '手机号码',
  `locationid` int(100) DEFAULT NULL COMMENT '地区ID',
  `mode_type` int(100) DEFAULT NULL COMMENT '注册登录模式',
  `regist_time` varchar(100) DEFAULT NULL COMMENT '注册时间',
  `user_exp` varchar(100) DEFAULT NULL COMMENT '用户当前经验值',
  `score` int(100) DEFAULT NULL COMMENT '累计积分',
  `user_level` int(100) DEFAULT NULL COMMENT '用户等级',
  `wxid` varchar(100) DEFAULT NULL COMMENT '微信ID',
  PRIMARY KEY (`uid`)
) ENGI
随着大数据时代的到来,能够牢牢的抓住老客户、吸引新客户、读懂用户的偏好兴趣以及挖掘用户的潜在价值,这些对于运营商的的发展至关重要。而达成这一目标需要对用户市场进行细分实现精细化营销,应用数据挖掘技术对用户进行画像,实现用户细分,其研究和发展在实现运营商精确营销、提高工作效率、减少经营成本方面具有重要的指导意义和实用价值。本文以移动互联网用户行为作为研究对象,以用户画像理论作为理论依据,提出了用户画像系统的建设思路,采用标签化方法对用户行为以及用户偏好特征进行描述。本文首先对用户画像系统进行整体的阐述,分别从具象的语义化以及抽象的数学模型来对用户画像系统进行概述,再者从动态性以及时空局限性对用户画像的特性进行描述,最后从建模的角度,将用户画像系统分为静态信息画像以及动态信息画像,对其中的用到的建模方法以及所使用的数据挖掘算法进行了详细的介绍。其次对用户画像的整体架构上进行了描述。分别从系统的总体设计和功能架构,以及业务架构方面将用户画像系统的设计思路进行详细的描述。再者文中结合运营商的经营特点以及业务经验,将用户画像系统分别从基础属性、业务属性、产品属性、渠道属性详细的阐述了用户静态信息标签构建的方法以及具体的分类。然后通过数据挖掘方法的方法实现中文分词,利用LDA聚类模型获得分词向量化从而获得用户文本的特征向量,接着利用改进的TF-IDF分类方法实现对用户不同维度信息的预测,从而构建了用户的互联网基础属性特征。其次通过对用户上网日志的解析和网络爬虫数据的匹配,构建内容的评分模型,实现对移动客户的特征、偏好等信息进行高度总结,从而生成用户移动互联网偏好特征标签,全面丰富了用户动态信息标签的构建。在此基础上,提出了用户画像系统运用列数据库对画像数据进行存储,标签元数据管理以及标签生命周期管理、查询机制和更新机制一系列完整的规范化的用户画像系统管理流程,从而构建一个完整闭环的用户画像系统。最后以营销过程中流量提升以及手机阅读软件用户量提升为例描述了用户画像系统在移动营销业务中的应用。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值