清洗的特点: 1.数据非完美,数据分析之前需要对数据进行清洗 2.数据清洗最耗时 3.清洗后的数据质量最关键,决定分析的准确性 4.唯一提高数据质量的方法 所用工具: numpy和pandas是最主流的工具