一、特征预处理:归一化
数据归一化:通过对原始数据进行变换把数据映射到【mi,mx】(默认为[0,1])之间。
1.sklearn.preprocessing.MinMaxScaler(feature_range=(0,1)… )feature_range缩放区间2.fit_transform(X)将特征进行归一化缩放
#import numpy as np
from sklearn.preprocessing import MinMaxScaler
#def dm01_MinMaxScaler():
# 1. 准备数据
data = [[90, 2, 10, 40],[60, 4, 15, 45],[75, 3, 13, 46]]
# 2. 初始化归一化对象
transformer = MinMaxScaler()
# 3. 对原始特征进行变换
data = transformer.fit_transform(data)
# 4. 打印归一化后的结果
print(data)
结果:
二、特征预处理:标准化
数据标准化:通过对原始数据进行标准化,转换为均值为0标准差为1的标准正态分布的数据
1.sklearn.preprocessing. StandardScaler()
2.fit_transform(X)将特征进行归一化缩放
from sklearn.preprocessing import StandardScaler
#def dm03_StandardScaler():
# 对特征值进行标准化
# 1. 准备数据
data = [[90, 2, 10, 40],[60, 4, 15, 45],[75, 3, 13, 46]]
# 2. 初始化标准化对象
transformer = StandardScaler()
# 3. 对原始特征进行变换
data = transformer.fit_transform(data)
# 4. 打印归一化后的结果
print(data)
# 5 打印每1列数据的均值和标准差
print('transfer.mean_-->', transformer.mean_)
print('transfer.var_-->', transformer.var_)
结果:
三、利用KNN算法对鸢尾花分类
3.1案例的总体处理流程
1、获取数据集
2、数据基本处理
3、数据集预处理-数据标准化
4、机器学习(模型训练)
5、模型评估
6、模型预测