一、数据一览与客户需求
在真实的业务场景中,分析始于问题、始于需求,而非开始于数据。所以千万不要拿到数据着急寻找珍珠,否则往往是越看越纠结。我拿到的数据是仅一分钟内的传感器数据,对方临时生成的数据,明显数据结构并非完美,原表中同时包含了原始数据和二次加工的分析数据。
对方想要查看的视图,一是左上角分析字段在60秒的波动情况,二是在每秒1000次(专业术语大概是1000Hz)的数值波动,查看波峰波谷,这里分为原始数据和傅里叶数据两种,每秒可以视为一个系列。客户之前使用Excel做了一个模拟,同时展示三秒的傅里叶数据波动,样图如下:
看上去,这个需求很简单啊,Tableau最入门的折线即可完成,不过前提是数据结构和完整性良好的情况下。都说数据整理要占据80%的时间,这里也逃不过去,数据整理还是需要点时间。
二、数据整理过程
使用Tableau Desktop导入数据之后,Excel中列(第1秒到60秒对应的60列)会被视为度量,而左侧字段(包括原始字段1到原始字段999)的大量数据被视为维度,并统一到一个字段之下。这样的数据存在几个问题:
- 第一个视图需求是分析某指