数仓 DW层中主题表之页面交互事件概况主题(分享,点赞,收藏)
1. 背景
- 在大数据开发中,本身的数据处理分析目的一般就是2类,一个是基于现有数据找出规律,做总结和分类统计。一个是基于现有数据找出规律,然后训练出模型,最后预测未来变化。
- 前者就是传统的大数据分析和处理
- 后者就是近几年火起来的机器学习
- 大数据处理中,数据来源一般是三大类,爬虫数据,行为日志埋点数据,业务数据。当然特殊场合还会有购买来的线程数据。
- 行为日志数据中,顾名思义,一般就是对用户行为记录的数据,由于目前都是互联网迭代敏捷开发,一个功能出现后,并不能很好确定对业务和业绩带来的变化是正面还是负面,以及影响程度。这时候就可以从行为日志中对一些基本指标做统计,从侧面来评估一个功能或者页面,或者流程对现有用户和业务业绩的影响。
- 赞,转,踩,收藏,很常见的四个指标,互联网需求开发中会经常遇到。本文就是解析基于行为日志数据对这几个指标做统计分析
2. 分享
- 分享的行为日志模拟数据
{"account":"","appId":"cn.doitedu.app1","appVersion":"3.4","carrier":"中国移动","deviceId":&#