TypeError: fit_transform() missing 1 required positional argument: ‘X‘——报错

山外小楼听夜雨.

已于 2022-04-06 19:51:43 修改

阅读量6.6k

点赞数 16

分类专栏： PyTorch深度学习文章标签： pytorch 机器学习深度学习

于 2022-04-06 18:02:56 首次发布

本文链接：https://blog.csdn.net/weixin_42521185/article/details/123990006

版权

PyTorch深度学习专栏收录该内容

40 篇文章 10 订阅

订阅专栏

文章目录

1 解决过程【成功】
2 学习Sklearn之数据预处理——StandardScaler
3 标准化和归一化区别？
4 数据处理时的选择

1 解决过程【成功】

源代码如下：


import pandas as pd
from sklearn.preprocessing import StandardScaler

# 1. 导入数据
def load_data() -> pd.DataFrame:
    data = pd.read_excel('data3.xlsx')
    print(data)
    data.columns = ['BillingDate', 'VolumnHL']  # 修改一下属性名
    print("======================")
    print(data)
    return data


# load_data()


# 2. 归一化（可以帮助模型更快拟合）
def max_min_normalization(data:pd.DataFrame) ->pd.DataFrame:
    # VolumnHL 是第二列属性
    volume = data.VolumnHL.values  # 单取出第二列，组成一个向量
    print("===max_min_normalizetion===================")
    print(volume)
    volume1 = volume.reshape(-1, 1)  # 改变volumn的形状，现在volume是一个一行多列的向量,改成多行一列的向量
    volume2 = volume.reshape(len(volume), 1)  # 与上一行的效果一样
    # print(volume1)
    # print(volume2)
    volume = StandardScaler.fit_transform(volume2)
    print(volume)


data = load_data()
max_min_normalization(data)

输出的报错信息：
解决：就是少了一个括号!!
当然，在很多代码中，还有很多教程喜欢这样去写:

scaler = StandardScaler()
x_train = scaler.fit_transform(x_train)

总而言之就是StanderScaler后面的()千万不要忘记！否则报错之后很难排查出来！

2 学习Sklearn之数据预处理——StandardScaler

2.1 数据处理——标准化、归一化

数据标准化和归一化，都属于数据特征无量纲的一种方式。
【“无量纲”——将不同规格的数据转换都统一规格，或不同分布的数据转换到某个特定分布的需求】
特别是对于需要计算梯度和矩阵的模型（例如逻辑回归中通过梯度下降求解损失函数），无量纲化之后的数据特征对于模型求解有加速作用！
在k近邻、聚类算法中，需要计算距离时，使用无量纲化可以提升模型精度，避免异常值对整体计算造成的影响。
中心化处理：让所有记录减去一个固定值，即让数据样本平移到某个位置；
缩放处理：通过除以某一个固定值，将数据固定在某个范围之内！

2.2 为什么要归一化？

归一化后加快了梯度下降求最优解的速度；
如果机器学习模型使用梯度下降Q法求最优解时，归一化往往非常有必要，否则很难收敛甚至不能收敛。
归一化有可能提高精度；
一些分类器需要计算样本之间的距离(如欧氏距离Q)，例如KNN。如果一个特征值域范围非常大，那么距离计算就主要取决于这个特征，从而与实际情况相悖(此如这时实际情况是值域范围小的特征更重要)。