- 很多情况下,为了洞察业务(自己想要得到答案的问题 或者 其他人向你提出的需求),需要获得相应的数据来提供分析;
- 当你在尝试分析、可视化的时候,你可能会需要添加更多的数据来达到你的分析目的,这需要清理、整合更多的数据;
- 后续的问题可能会需要更多额外的数据,这也需要清理、整合。
示例文件链接: 百度网盘 请输入提取码百度网盘为您提供文件的网络备份、同步和分享服务。空间大、速度快、安全稳固,支持教育网加速,支持手机端。注册使用百度网盘即可享受免费存储空间https://pan.baidu.com/s/1FZKRRI8K7vD9ch5vENT8mw?pwd=AQWF 提取码: AQWF
第一步:输入数据
首先,打开Tableau Prep Builder,连接-文本文件(选择刚才下载的示例文件“Non-Profit Donations South.csv”);
连接之后的界面:
第二步:清理数据
添加一个“清理步骤”,对数据进行清理;
界面会变成这样:
可以看到,“Donor Potential”字段取值有一些异常:同样的级别使用了不同的表示方式,比如Hi和High,Lo和Low,Med和Medium,来检查一下数据:
点击“…”,可以进行这些操作:
双击,修改:
按回车键后:
保存一下,后续可以接着继续清理,可以点击“保存”按钮,也可以点击“文件”-“另存为”;
下面用第二种方法来合并同样的级别Low和Lo;
点击“…”-“将值分组”-“手动选择”;
选择“Low”;
再勾选“Lo”,然后点右上角的“完成”:
点击“完成”之后,返回看到,Low和Lo合并为了新的一个组Low:
展开“更改”详情面板,可以看到所做的更改:
可以重命名这个清理步骤,右键点击步骤“清理1”,选择“重命名”:
“文件”-“另存为”-“打包Tableau流程文件*.tflx”,这样就随流程一起打包了本地文件(Excel、文本文件和 Tableau 数据提取),可以将完整数据分享给别人;
第三步:导出数据,这样清理后的数据可以作为数据分析的数据源
新增一个“输出”步骤:
保存数据源:将输出保存到 “文件”,点“浏览”,命名文件,点“接受”;
点击“运行流程”,完成之后,才算是输出完成了清理后的数据源;
给你参考一下哈:刚才在Tableau Prep Builder中输出的.hyper文件:
第四步:在Tableau Desktop中连接清理后的数据源
点击“更多”,找到刚才输出的文件,“打开”;
打开之后,即连接上了数据源,切到“工作表1”,开始进行分析,左键点击“Donation Amount”拖动到“行”,左键点击“Donation Date”拖动到“列”(点击右侧的小倒三角,选择“年”);
左键点击“Donor Potential”拖动到“颜色”标记;
给你参考一下哈:完成这一步分析后,保存的文件:“Donation数据分析.twb”,可以直接在Tableau Desktop中打开;