数据归一化

最新推荐文章于 2024-05-03 22:05:55 发布

ScrapingBoy

最新推荐文章于 2024-05-03 22:05:55 发布

阅读量754

点赞数 1

分类专栏：机器学习文章标签：神经网络数据处理

本文链接：https://blog.csdn.net/y_h_k_666/article/details/123610980

版权

机器学习专栏收录该内容

6 篇文章 0 订阅

订阅专栏

数据归一化

归一化(Normalization)：将一列数据变化到某个固定区间(范围)中，通常，这个区间是[0, 1]，广义的讲，可以是各种区间，比如映射到[0，1]一样可以继续映射到其他范围，图像中可能会映射到[0,255]，其他情况可能映射到[-1,1]。

1. 公式

$X_{normalization} = \frac{X_i-X_{min}}{X_{max}-X{min}}$

2. 实现

自己实现：

def normalization(X):
    """X : ndarray 对象"""
    min_ = X.min(axis=0)        # 得到的是 Series 对象
    max_ = X.max(axis=0)
    row_num = X.shape[0]        # row_num 是X的行数
    ranges = max_ - min_
    print(ranges)
    molecule = X - np.tile(min_, (row_num, 1))     # np.tile(A, (row, col) ) :把A(看做整体)复制row行，col 列,分子:X-min
    denominator = np.tile(ranges, (row_num, 1))    # 分母 max-min
    X = molecule/denominator
    return X, min_, ranges

调包实现

from sklearn.preprocessing import MinMaxScaler

def normalization2(X):
    minmax = MinMaxScaler()  # 对象实例化
    X = minmax.fit_transform(X)
    return X

全部代码：


import pandas as pd
import numpy as np
from sklearn.preprocessing import MinMaxScaler

def normalization(X):
    """X : ndarray 对象"""
    min_ = X.min(axis=0)        # 得到的是 Series 对象
    max_ = X.max(axis=0)
    row_num = X.shape[0]        # row_num 是X的行数
    ranges = max_ - min_
    molecule = X - np.tile(min_, (row_num, 1))     # np.tile(A, (row, col) ) :把A(看做整体)复制row行，col 列,分子:X-min
    denominator = np.tile(ranges, (row_num, 1))    # 分母 max-min
    X = molecule/denominator
    return X, np.array(min_), np.array(ranges)


def normalization2(X):
    minmax = MinMaxScaler()  # 对象实例化
    X = minmax.fit_transform(X)
    return X

if __name__ == '__main__':

    data = pd.DataFrame({0: [2, 1, 5, 4, 3],
                         1: [8, 7, 10, 9, 6]})
    print(data)
    X, x, y = normalization(np.array(data))
    print(X)
    print(x)
    print(y)

    X = normalization2(data)
    print(X)