Python机器学习:KNN算法07数据归一化

数据归一化

import numpy as np
import matplotlib.pyplot as plt

最值归一化

生成0-100,100个整数

#最值归一化 Normalization
x = np.random.randint(0,100,size = 100)
print(x)
(x - np.min(x)) / (np.max(x) - np.min(x))
X = np.random.randint(0,100,(50,2))
print(X[:10,:])
X = np.array(X,dtype=float)#强制转化成float
X[:,0] = (X[:,0] - np.min(X[:,0])) / (np.max(X[:,0]) - np.min(X[:,0]))
X[:,1] = (X[:,1] - np.min(X[:,1])) / (np.max(X[:,1]) - np.min(X[:,1]))
print(X[:10,:])

在这里插入图片描述

plt.scatter(X[:,0],X[:,1])#归一化了

在这里插入图片描述

np.mean(X[:,0])
np.std(X[:,0])

在这里插入图片描述

均值方差归一化

#均值方差归一化
X2 = np.random.randint(0,100,(50,2))
X2 = np.array(X2,dtype=float)

X2[:,0] = ((X2[:,0]) - np.mean(X2[:,0])) / np.std(X2[:,0])
X2[:,1] = ((X2[:,1]) - np.mean(X2[:,1])) / np.std(X2[:,1])

print(np.mean(X2[:,0]))
print(np.std(X2[:,0]))

-1.1546319456101628e-16
0.9999999999999999

在这里插入图片描述

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
边界:比如学生成绩0-100,图像像素0-255,适合最值归一化,不适合收入,因为没有边际…
在这里插入图片描述
极端数据,均值方差归一化

在这里插入图片描述

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值