很多数据分析爱好者都会使用Power BI构建Dashboard、可视化数据。
然而,在对复杂的Dashboard进行建立和改进时,总会通过不同的字段和相应表格,不断添加或删除Widget。
经过多次更改后,数据结构会看起来很杂乱——原先帮助构建Dashboard的那些表格和列表变得混乱不堪。一番数据处理后,最终的Dashboard可以包含所有当前使用字段。
不幸的是,在Power BI上实现Dashboard全预览的唯一方法是,自行浏览所有Widget的数据,并手动写下那些已用字段。
但程序员都会努力避免不必要的手动操作,所以我们应该好好钻研,寻找这方面的解决方案。别担心,最后的解决方案出奇地简单!
解构PBIX文件
整理Power BI而不直接使用的第一步是研究.PBIX文件。WinRAR等免费压缩文件能够解压任何.PBIX文件。以上功能给用户提供了一系列不同的文件格式和目录选择,为后续的分析和操控创造可能。
浏览解压文件时,可以看到一个内含“layout”的“Report”的文件夹。这个文件夹包含了有关Dashboard的视觉结构的所有信息,比如:
• 每个Widget的大小和x/y坐标
• 已用字段名称
• 所有的设置和参数
• 标题
• ……以及其他海量信息
layout文件看起来由一串JSON、表单和词库共同构成。我们打算使用Python对所有数据字段和已用Widget进行总结。