sklearn与pandas的缺失值处理
housing数据集中的total_bedrooms有部分缺失,对于缺失值,通常我们有以下几种方式处理:
放弃有缺失值的样本
放弃整个特征
将缺失值设置为某个默认值:0、平均值、中位数等。
pandas方式
通过DataFrame的dropna(), drop()和fillna()函数,可以方便的实现以上3个功能:
housing.dropna(subset=['total_bedrooms'])
housing.info()
housing.drop('total_bedrooms', axis =
原创
2021-07-15 11:14:48 ·
396 阅读 ·
0 评论