目录
一、背景
Power BI 是目前在企业数据可视化应用上非常火热的工具。Power BI 通过数据建模、数据制图、数据分享等方案将数据通过清晰、直观的视觉展现给用户。
Power BI 的优势在于其简单易用、交互性强、可视化效果好,而且支持多种数据源,如 SQL Server、Excel、SharePoint 等,以及各种数据格式,如 TXT、CSV、XML。
但是 Power BI 的数据清洗功能较弱,通常在数据清洗前需要通过 SQL Server Integration Services (SSIS) 或其他 ETL 工具进行数据清洗与转换,这增加了数据集成的复杂度,增加了数据整理和管理的成本。
二、数据清洗的概念
数据清洗是指对原始数据进行处理、转换、整理、清除、去重、去除扭曲错误等操作,目的是消除数据中的异常、冗余、错误地点和缺失数据,确保数据的准确性和完整性,从而提高数据的可靠性和稳定性。
数据清洗的目的主要有以下两点:
-
去掉重复和不必要的数据,使数据更加有效。
-
通过清洗和填充,使数据更加完整和准确。
三、Power BI 数据清洗的挑战
Power BI 的数据清洗功能相对较弱