缺省值处理

最新推荐文章于 2024-04-02 19:18:40 发布

大数据私房菜

最新推荐文章于 2024-04-02 19:18:40 发布

阅读量4.1k

点赞数

分类专栏：机器学习

本文链接：https://blog.csdn.net/zuochang_liu/article/details/90267633

版权

机器学习专栏收录该内容

8 篇文章 0 订阅

订阅专栏

如何处理数据中的缺失值？

删除	如果每列或者行数据缺失值达到一定的比例，建议放弃整行或者整列
插补	可以通过缺失值每行或者每列的平均值、中位数来填充

sklearn缺失值API: sklearn.preprocessing.Imputer

Imputer语法：

Imputer流程：

关于np.nan(np.NaN)：

1、 numpy的数组中可以使用np.nan/np.NaN来代替缺失值，属于float类型

2、如果是文件中的一些缺失值，可以替换成nan，通过np.array转化成float型的数组即可

# coding=utf-8
_author_ = 'liuzc'
from sklearn.preprocessing import Imputer
import numpy as np
def im():
    """
    缺失值处理
    :return:NOne
    """
    # NaN, nan
    im = Imputer(missing_values='NaN', strategy='mean', axis=0)
    data = im.fit_transform([[1, 2], [np.nan, 3], [7, 6]])
    print(data)
    return None

if __name__ == "__main__":
    im()

结果：

[[ 1. 2.]
[ 4. 3.]
[ 7. 6.]]

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

大数据私房菜

关注关注

0
点赞
踩
3

收藏

觉得还不错? 一键收藏
打赏
0
评论
缺省值处理

如何处理数据中的缺失值？删除如果每列或者行数据缺失值达到一定的比例，建议放弃整行或者整列插补可以通过缺失值每行或者每列的平均值、中位数来填充 sklearn缺失值API: sklearn.preprocessing.ImputerImputer语法：Imputer流程：...
复制链接

扫一扫