对数据进行标准化，归一化。

最新推荐文章于 2022-01-17 22:19:20 发布

孤数不证

最新推荐文章于 2022-01-17 22:19:20 发布

阅读量3k

点赞数

本文链接：https://blog.csdn.net/weixin_43668299/article/details/97665210

版权

一，归一化。
归一化是利用特征的最大最小值，将特征的值缩放到[0,1]区间，对于每一列的特征使用min-max函数进行缩放，计算公式如下
在这里插入图片描述

 import pandas as pd
from sklearn.preprocessing import MinMaxScaler

if __name__ == "__main__":
#读取葡萄酒数据集
data = pd.read_csv("G:/dataset/wine.csv")
#获取第二列Alcohol
x =data["Alcohol"]
#获取数据的基本情况
print(x.describe())
minMax = MinMaxScaler()
#将数据进行归一化
x_std = minMax.fit_transform(x)
print(x_std)

二，标准化。
标准化比归一化要更加实用，因为像逻辑斯蒂回归和支持向量机算法，刚开始训练的时候会将参数初始化为0或趋于0的随机极小值，如果是标准化的数据(均值为0，方差为1)对于它们而言，这更加容易利于权重的更新。将特征列标准化的计算公式如下

在这里插入图片描述

import pandas as pd
from sklearn.preprocessing import MinMaxScaler
from sklearn.preprocessing import StandardS

最低0.47元/天解锁文章

孤数不证

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
对数据进行标准化，归一化。

一，归一化。归一化是利用特征的最大最小值，将特征的值缩放到[0,1]区间，对于每一列的特征使用min-max函数进行缩放，计算公式如下 import pandas as pdfrom sklearn.preprocessing import MinMaxScalerif __name__ == "__main__":#读取葡萄酒数据集data = pd.read_csv("G:/d...
复制链接

扫一扫