数据清洗及特征处理
1.缺失值观察
a:info
b:isnull()sum()
2.缺失值的处理办法
a:dropna().head()
b:fillna().head()
3.重复值观察及处理
a:duplicated()
4.特征观察与处理
数值型特征
文本型特征
5.分箱(离散化)处理
6.文本变量的转换
数据清洗及特征处理
1.缺失值观察
a:info
b:isnull()sum()
2.缺失值的处理办法
a:dropna().head()
b:fillna().head()
3.重复值观察及处理
a:duplicated()
4.特征观察与处理
数值型特征
文本型特征
5.分箱(离散化)处理
6.文本变量的转换