Data Clean
定义
- 数据清洗也叫数据清理,
- 是指从数据库或数据表中更正和删除不准确数据记录的过程。
广义地说,数据清洗包括识别和替换:
不完整、
不准确、
不相关、
或有问题的数据和记录。
作用
通过有效的数据清洗,能够确保所有数据集应保持一致并且没有任何错误,为以后数据的使用和分析提供支撑。
必要性
- 数据可以说是企业用于支持和指导其业务成功的最重要资产之一,不准确的数据可能会导致的一些问题包括:
(1)市场营销:
使用了低质量数据的广告活动并联系不相关的优惠用户,不仅降低了客户满意度,而且错过了重大的销售机会。
(2)销售:销售人员由于没有完整、准确的数据而未能联系以前的客户。
(3)合规性:任何不符合客户数据隐私规则的线上业务会受到监管部门的处罚。
(4)生产操作:依据低质量操作数据配置生产机器,可能导致制造公司出现重大问题,而企业如果有干净的数据,那么所有这些问题都可以避免。 - 数据清洗的好处
(1)改进业务实践
(2)提高工作效率
(3)更快的销售周期
(4)更好的决策
这些不同的好处结合起来,通常会使企业的业务获得更大程度的改善,这不仅能够让外部销售业务变得更有效,还能够提供更高效的内部管理和运营。
未完待续……