一、报表开发背景
因公司数据中心数据库迁移且新修改了一些字段,原有报表需要进行报表重构,因为需要重新取数(sql代码需要重新写),Tableau里面的字段命名,参数,计算字段等也需要修改,此外,格式字体等也需要重新弄,好在有原方案报表可以参考,不属于从0-1的构建,属于技术重现。
二、实现过程
2.1 熟悉新数据库、表、字段
数据源方面:旧数据源来源于两个数据库,共四个数据库,取数需要跨数据库。新数据源取数来源于一个数据库,共需三个表。
新数据源共涉及:订单表、商品详情表和员工信息表。
2.2 明确分析维度和关键指标(这是关键)
总共需要技术重构两个仪表盘,共13个可视化表,13个分析维度。
因涉及业务所以省去关键信息,举例进行说明:
(1) 成交量随时间变化的关系
(2) 不同区域销量的分布
(3) 退单商品在订单中的比例
例如按区域、分公司、营业部统计销售商品的数据量、金额等。
我本次开发属于技术重现,不属于从0-1的实现,我觉得个人需要学习的点在于,接到开发需要首先自己要和业务沟通业务需求,也就是明确分析维度和分析指标,怎么定义的,例如影响成交的因素(字段)有哪些?从业务逻辑中理解表与表之间的区别,分析维度需要考虑哪些字段,需要加上哪些条件?这才是难点?
如图2.2显示仪表盘显示两个分析维度:(1)各城市销售/利润关系?;(2)各产品盈利情况(亏损/盈利)与时间的关系?
2.3 细节修改
数据新数据源,明确号分析维度,关键指标后,开始撰写sql代码取数,然后在Tableau重命名,设定需要的参数,计算字段,一个分析维度一个工作表,表的制作涉及很多技术细节,只有通过具体项目去练习,目前对Tableau之前只是了解,会基本功能,但目前任然需要继续修炼一遍达到工作要求。工作表完成分析维度的可视化要求后,像写论文一样还需要调节字体格式大小,图形颜色等。最后讲内容和格式都ok的工作表拖进仪表盘,接下来最后一步对仪表盘的布局进行调整和优化。举例说明如2.3图骑行路线所示:
2.4 报表发布
报表开发完成后进行报表发布,以及数据源的更换等。
三、个人收获与感悟
3.1 对BI开发的理解
目前本人依旧属于报表取数开发,尚未独当一面和业务对接,属于在数据中心内部协助其他分析师完成报表开发,但通过具体任务也了解到一些业务开发流程。目前对BI数据分析的理解这个岗位不需要很高深的代码能力,基础工作只需要sql+excel+Tableau,sql从mysql数据库中取数,然后在Excel或者Tableau中里加工可视化后做成报表或者报告。
找工作之前自己的定位是大数据分析师,自己学习了python,学习了一些算法,学习了大数据分析师的一些技能,例如hadoop(分布式并行计算框架),hive(基于Hadoop的一个数据仓库工具),但实际工作中暂时用不到。3.2 未来个人努力方向
BI之路继续锻炼(一个优秀BI,就是让决策者决策变“懒”,让决策者做选择题而不是填空题),终极目标是走向数据挖掘道路(也就是数据分析偏技术的岗位,主要技能是数学功底+统计功底+实打实的写代码能力+看论文读最新算法论文的能力,要求相当高,当然薪资也更高)
同时对数据的埋点,数据仓库,数据中台也要做一些了解。