语论
应球友建议,将语数精选改为语论,语论即为语兴式论语,以语录体及对话的形式,沉淀球友实际工作学习中存在的疑难杂症解答,希望能够更好的帮助到球友和粉丝。欢迎关注公众号:语数
本期语论
- 什么是数据产品?
- 指标体系方法论重点关注
- 有关报表的提问
第一个问题
何为数据产品
先介绍一下数据产品:
为业务或技术提供可视化内容展示或开发平台设计,数据产品分为2大类,即B端和C端两种。
-
tob则是对内支持(公司内部数据平台支持)也有对外支持(云产品服务),更偏向开发者及分析师,与数据平台开发形成配合完成数据平台规划建设。
-
toc则是为用户提供查看高价值数据渠道的平台,C端设计产品时要从使用数据者的角度出发辅助用户分析,使得用户能够进行自助决策。
-
c端注重业务,b端注重数据建设流程面向开发的,看自己目前现状更适合哪些。
-
市面上b端吃香 尤其是指标中心、数据治理中心的数据产品很火,建议往这个方面看看。
-
b端也分很多的 网易这边 数据产品是按照功能分的,例如数据传输是一个产品、数据治理是一个产品、标签/指标平台是一个产品,像数仓一样也有很多分支
其实数仓更好转数据产品,因为数仓深知用户痛点,用多了数据平台也具备了自己对平台功能的理解,同时互联网高p数据负责人,挺多是数据产品,比如快手、红薯、网易数据负责人都是数据产品,还都是数仓出身。
第二个问题
如何更好的建设指标体系
-
分析痛点:了解当前数仓侧与业务应用方对指标到不到、难使用的痛点及日常指标使用习惯,制定指标中心所需功能并设计指标中心样式。
-
制定指标规范:定义指标类型、指标使用方、确定指标域(这里是数据域)、指标要具备的属性(业务/技术口径、负责人、类型等)。
-
梳理当前指标:用在线excel整理数据/主题域对应的指标,优先找ads交集的核心指标,并区分核心与非核心,溯源每一层级并记录。
-
与业务方沟通:按照数据/主题域与业务方确定指标口径与来源唯一性,并对高频、低频指标打标(无应用指标优先下线)。
-
建设指标中心:完成指标中心各个模块(创建、编辑等)及搜索跳转功能开发,并创建后台数据库及指标内容数据表用于后续数据存放,后续接入数仓,通过用户指标行为的明细数据加工及指标维度表下维度退化,建设指标侧应用数据模型,用于统计指标颗粒度下使用情况(热度、查询率、被引用情况等),再与前端开发团队配合完成可视化界面搭建支撑界面应用。
-
公共指标模型建设:将已梳理的重复的公共逻辑提取出来,并集中建设成公共数据模型,消除冗余代码,解决复用性。
-
设立指标规范:与业务方共创维护指标上下线/变更流程,设立接口人,保障流程规范性8.指标维护:制定指标评分规范,通过指标热度及使用情况打分,对无用指标定期提醒及下线。
第三个问题
关于报表
- 报表开发与数仓各层模型设计开发有何关联?
- 就前端展示,如何有什么好的方法设计报表?
- 你认为报表开发的重点是什么?
- 怎么样快速支撑报表开发?
语兴回答
-
一般报表只跟应用层联系最多,即标签或指标的方式给到下游应用。
-
建议是使用报表工具开发后让前端嵌套到数据产品中。
-
重点是突出核心指标,以及信息的总结(我采访过挺多决策层,他们都希望在核心指标展示后能附加一个结论,可以是定期更新写死的内容也可以是用数据拼接的内容),筛选核心筛选项即维度,并附加跳转明细及下钻。
-
快速支持报表开发,主要在于前期数分与数仓沟通时候,数分能清楚到底要看什么方向指标,以及北极星指标拆解后的口径内容(一定要确定指标口径,如果只是看看,可让他们自己写sql加工),当确定完指标后数仓可优先设计ads模型划分主题先给到数分侧空表让他们把看板搭起来,如果数据还没接入可设计好ads 后开始接入,后续等数分将看板搭建好后数仓这边也几乎完成ads数据模型开发,共同抽1天去测试即可,当出现开发加测试时间很紧迫的时候,可优先做ods 穿透 后续补dwd dws。