特征处理

特征处理

from sklearn.feature_extraction import DictVectorizer
from sklearn.feature_extraction.text import CountVectorizer, TfidfVectorizer
from sklearn.preprocessing import MinMaxScaler, StandardScaler
from sklearn.impute import SimpleImputer
import pandas as pd
import numpy as np


# 归一化
# def minmax():
#     mm = MinMaxScaler(feature_range=(2, 3))  默认区间为(0,1)可设置为任意区间#
#     data = mm.fit_transform([[90, 4, 20, 60], [60, 6, 80, 30], [85, 2, 50, 40]])
#     print(data)

# 标准化
# def standards():
#       std = StandardScaler()
#       data = std.fit_transform([[90, 4, 20, 60], [60, 6, 80, 30], [85, 2, 50, 40]])
#       print(data)

# 数值缺失
def impu():
    imp = SimpleImputer(missing_values=np.nan, strategy='mean')
    data = imp.fit_transform([[1, 2, 5], [np.nan, 8, 3], [7, 6, 4]])
    print(data)


if __name__ == '__main__':
    impu()
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值