![a6d0e5c619ee94515ae56ea66a69e364.png](https://i-blog.csdnimg.cn/blog_migrate/02101ac705732e8d24346c856797d359.jpeg)
![74b161df773e192ce67fe5e9a667acad.png](https://i-blog.csdnimg.cn/blog_migrate/8982c00d003e18a0d690da11d879e4f8.jpeg)
一 数据清理/处理
1. 缺失值
![4afc002ded458bd217ddc64cc3ed0bae.png](https://i-blog.csdnimg.cn/blog_migrate/77628540e83d954c6898f394e82e157e.png)
# 数据导入后了解数据的三板斧:
df.shape() #数据有几行几列
df.info() #基本信息,可以看到缺失值
df.describe() #描述统计
# 缺失值/非缺失值总计
df.isnull().sum() #按行汇总缺失值数
df.isnull().sum().sum() #缺失值总计
df.notnull().sum() #按行汇总非缺失值数
df.notnull().sum() #非缺失值总计
缺失值处理的一般方法:
<