用编程方法进行 数据清理
编程清理步骤分三步:
1. Defining
2. Coding
3. Testing
清理之前先将数据备份:df_clean = df.copy()
注意:不能只简单地赋值:df_clean = df
。因为它不能产生新的 pandas 对象,只会产生一个引用,对 df_clean
进行操作,仍能改变 df
。
举例说明
1. 方案确定(Define)
确定处理问题的方案,以文字形式记录下来。
2. 代码编写(Code)
然后,将处理方案转化为代码。
3. 效果检验(Test)
最后,检验数据,看代码是否奏效。
也可以确定完一个方案后,立即进行代码编写,效果检验。对于数据问题较多时,尤其适用。