用sklearn库快速实现数据处理

啊金曼

已于 2022-06-17 20:27:44 修改

阅读量152

点赞数

分类专栏：数据分析基础工作文章标签： sklearn python 人工智能

于 2022-06-17 20:23:43 首次发布

本文链接：https://blog.csdn.net/weixin_43726651/article/details/125232699

版权

数据分析基础工作专栏收录该内容

3 篇文章 0 订阅

订阅专栏

数据预处理

（1）缺失值处理

from sklearn.preprocessing import Imputer

1）用平均数填充

2）用中位数填充

3）用最频繁值（众数）填充

import pandas as pd
import numpy as np
from sklearn.preprocessing import Imputer

//均值填充
data1 = data
imp = Imputer(missing_values='NaN',strategy='mean')
imp.fit(data1)
data1 = imp.transform(data1)

//中位数填充
data2 = data
imp = Imputer(missing_values='NaN',strategy='median')
imp.fit(data2)
data2 = imp.transform(data2)

//众数填充
data3 = data
imp = Imputer(missing_values='NaN',strategy='most_frequent')
imp.fit(data3)
data3 = imp.transform(data3)

（2）数据标准化

from sklearn.preprocessing import StandardScaler

from sklearn.preprocessing import StandardScaler
data = pd.read_excel("data_path")
data1 = data
scaler = StandardScaler()
scaler.fit(data1)
data1 = scaler.transform(data1)

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

啊金曼

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
用sklearn库快速实现数据处理

数据预处理（1）缺失值处理from sklearn.preprocessing import Imputer1）用平均数填充2）用中位数填充3）用最频繁值（众数）填充（2）数据标准化from sklearn.preprocessing import StandardScaler
复制链接

扫一扫