机器学习中为什么要做归一化normalization

最新推荐文章于 2023-02-17 18:55:29 发布

sas???

最新推荐文章于 2023-02-17 18:55:29 发布

阅读量623

点赞数

文章标签：人工智能 python

原文链接：https://segmentfault.com/a/1190000015283224

版权

我们处理feature的时候往往先要normalize encoding，使用python可以很容易做：

from sklearn import preprocessing
from scipy.stats import rankdata

x = [[1], [3], [34], [21], [10], [12]]
std_x = preprocessing.StandardScaler().fit_transform(x)
norm_x= preprocessing.MinMaxScaler().fit_transform(x)
norm_x2= preprocessing.LabelEncoder().fit_transform(x)

print('std_x=\n', std_x)
print('norm_x=\n', norm_x)
print('norm_2=\n', norm_x2)

print('oringial order =', rankdata(x))
print('stand order    =', rankdata(std_x))
print('normalize order=', rankdata(norm_x))

其中preprocessing.LabelEncoder().fit_transform(x)就是做normalize encoding，上面的程序输入如下：

std_x=
 [[-1.1124854 ]
 [-0.93448773]
 [ 1.82447605]
 [ 0.66749124]
 [-0.31149591]
 [-0.13349825]]
norm_x=
 [[0.        ]
 [0.06060606]
 [1.        ]
 [0.60606061]
 [0.27272727]
 [0.33333333]]
norm_2=
 [0 1 5 4 2 3]
oringial order = [1. 2. 6. 5. 3. 4.]
stand order    = [1. 2. 6. 5. 3. 4.]
normalize order= [1. 2. 6. 5. 3. 4.]

可以看到normailize之后的结果是 [0 1 5 4 2 3]。这样做的好处是什么呢？

下面图片转自知乎（https://www.zhihu.com/questio...）

图片描述

关注

0
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

sas??? CSDN认证博客专家 CSDN认证企业博客

码龄9年

162: 原创

-: 周排名

35万+: 总排名

143万+: 访问

: 等级

8436: 积分

5842: 粉丝

236: 获赞

30: 评论

1135: 收藏

私信

关注

热门文章

最新评论

C#double转化成字符串保留小数位数, 不以科学计数法的形式出现。
路人甲v01: 这个方法极慢，不宜使用。
Unity SDK JDK 环境配置避免各种莫名其妙的报错
xia199210: 图片看不了啦，更新图片啊大哥
Nginx多层代理配置
明N1ce: 中规中矩
[转]bootstrap table本地数据使用方法
lxtalent: 为啥还是渲染不了数据 [/code][code=html] $('#table').bootstrapTable('load', newData); $('#table').bootstrapTable({ data: newData, classes: 'table table-hover', striped: true, //是否显示行间隔色 //cache: false, //是否使用缓存，默认为true，所以一般情况下需要设置一下这个属性（*） pagination: true, //是否显示分页（*） sortable: true, //是否启用排序 sortOrder: "asc", //排序方式 sidePagination: "server", //分页方式：client客户端分页，server服务端分页（*） pageNumber: 1, //初始化加载第一页，默认第一页,并记录 pageSize: rows, //每页的记录行数（*） pageList: [10, 25, 50, 100], //可供选择的每页的行数（*） search: false, //是否显示表格搜索 strictSearch: false, showColumns: false, //是否显示所有的列（选择显示的列 clickToSelect: true, //是否启用点击选中 [/code]
Unity SDK JDK 环境配置避免各种莫名其妙的报错
fkggggg: 求更新图片

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。