缺失值处理 SimpleInputer

最新推荐文章于 2024-04-16 21:32:09 发布

飞跃小龙猫

最新推荐文章于 2024-04-16 21:32:09 发布

阅读量938

点赞数

分类专栏：数据挖掘文章标签： python 概率论数据挖掘

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/m0_46524771/article/details/122255503

版权

数据挖掘专栏收录该内容

9 篇文章 1 订阅

订阅专栏

import numpy as np
import pandas as pd

dic = {'col1':[1,2,3,4,5],
       'col2':[1,np.nan, 3, np.nan, 6],
       'col3':[1,2,np.nan, np.nan, 5],
       'col4':['aaa','bbb',np.nan, 'ccc','bbb'],
       'col5':['bbb','ccc','ccc', np.nan, np.nan]}


# 字典转DataFrame
df = pd.DataFrame(dic)
print(df)

from sklearn.impute import SimpleImputer # 模型

# missing_values=np.nan 指定缺失值
# strategy = “mean” 填充方式：均值、中位数、众数
# fill_value 指定填充值

# 采用合适的方法进行填充
s = SimpleImputer(strategy="mean") # 均值填充 均值、中位数、众数等等

for col_name in ['col2','col3']:
        df[col_name] = s.fit_transform(df[col_name].values.reshape(-1,1))  # [1,np.nan, 3, np.nan, 6]

print(df)

s2 = SimpleImputer(strategy="constant", fill_value="eee")
for col_name in ["col4","col5"]:
        df[col_name] = s2.fit_transform(df[col_name].values.reshape(-1,1))
print(df)

飞跃小龙猫

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

飞跃小龙猫 CSDN认证博客专家 CSDN认证企业博客

码龄5年

31: 原创

14万+: 周排名

57万+: 总排名

2万+: 访问

: 等级

330: 积分

10: 粉丝

7: 获赞

18: 评论

46: 收藏

私信

关注

热门文章

分类专栏

最新评论

SVM案例（附代码）
m0_72225210: 你好可以分享一下数据集吗，之前的链接失效了
SVM案例（附代码）
m0_72225210: 你好有没有数据集啊，原来的数据失效了
SVM案例（附代码）
小南同学@: 您好分享的数据集失效了能继续分享一下嘛
SVM案例（附代码）
teasing&poking: 好的谢谢！ plt.scatter(clf.support_vectors_[:, 0], clf.support_vectors_[:, 1], s=80, facecolors='none')（68行）的作用是啥呢？我跑了好几个svm，删去结果是一样的
SVM案例（附代码）
飞跃小龙猫: 【尊敬的超级会员V6】通过百度网盘分享的文件：testSet.txt 链接：https://pan.baidu.com/s/116mxogCUlL3mh8SzgUNc1g 提取码：9811

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。