杨桃的Python进阶讲座10——数组array(三)数组array归一化和标准化(全网迄今最详细的讲解)

本文详细介绍了在机器学习和深度学习中数据预处理的关键步骤——归一化和标准化。归一化是将数据统一到0~1范围内,而标准化则是使数据接近均值为0,标准差为1的高斯分布。文中提供了具体的计算公式,并通过实例解释了如何使用numpy库进行操作。
摘要由CSDN通过智能技术生成

本人CSDN博客专栏:https://blog.csdn.net/yty_7

Github地址:https://github.com/yot777/

 

在机器学习和深度学习中的数据预处理环节,一个非常重要的步骤是对数据进行归一化标准化处理。

 

归一化的概念

什么是归一化?简单的说,就是通过计算把所有的数据归纳统一到指定范围中去,一般这个范围是0~1。

 

归一化的公式

如何进行归一化?可以通过以下两个公式进行:

(1)变换系数公式

item代表数组每列中所有的元素

max为该列所有数据的最大值,min为该列所有数据的最小值

原始array数组如下:

>>> import numpy as np
>>> data = np.array([[36,46],[45,25],[6,79]])
>>> print(data)
[[36 46]
 [45 25]
 [ 6 79]]

步骤1:求出每列的最小值和最大值

>>> n_max=np.max(data,axis=0)
>>> print(n_max)
[45 79]
>>> n_min=np.min(data,axis=0)
>>> print(n_min)
[ 6 25]

步骤2:由原始矩阵的每一个元素减去该列元素的最小值n_min,得到公式的分子

>>> fenzi = np.subtract(data,n_min)
>>> print(fenzi)
[[30 21]
 [39  0]
 [ 0 54]]

讲解:n_min原来是一维数组(,2)<

  • 0
    点赞
  • 13
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值