"""
本类用于实现数据标准化
标准化的目的是使得不同的特征的量级近似或相同
"""
import numpy as np
class DataStandardization:
# 定义构造函数(构造方法),初始化参数
def __init__(self, feature, data=None):
self.feature = feature
self.data = data
# 定义Z-score标准化函数
def Z_ScoreStandardization(self):
# X_标准化后的数据 = (X - X的均值) / X的标准差
# 得到均值
mean = np.mean(self.feature, axis=0) # axis=0的意思是对每一列的数据进行取平均值操作
# axis=1就是对每一行操作
# 得到标准差
standard_deviation = np.std(self.feature, axis=0)
# numpy数组会直接把对应列的数值减去对应列的均值,不需要for循环
feature_standard = (self.feature-mean) / standard_deviation
return feature_standard
# 最大最小值标准化函数
def Max_MinStandardization(self):
# X' = (X - X_min) / (X_max - X_min)
max_value = np.max(self.feature, axis=0)
min_value = np.min(self.feature, axis=0)
feature_standard = (self.feature-min_value) / (max_value-min_value)
return feature_standard
05-13
“相关推荐”对你有帮助么?
-
非常没帮助
-
没帮助
-
一般
-
有帮助
-
非常有帮助
提交