点击蓝色字免费订阅,每天收到这样的好信息
前言:从洗菜看数据清理
菜买回来后,我们就要根据菜品的需要对它们进行处理了,但无论如何处理,在此之前们都需要对它们先进行清洗一下,将上面的脏东西诸如泥土、农药、血水等清洗掉。数据分析也是一样,在数据获取到了之后,我们需要进行的是数据清理;主要是解决如:数据损坏、不一致、不准确、不相关、脏数据、不标准化、不完整……等问题,将数据变干净,方便后续处理、分析、呈现。
一、清理原则
清理主数据为已使用主数据编码,对于未使用的主数据编码采取停用等方式。
各专业系统中基础编码数据,保留原编码规则,不进行编码改动,仅完善维护相关属性值。
属性值不完整的编码数据,