神经网络做分类所遇见的一些函数

cddeer

已于 2022-12-17 18:38:48 修改

阅读量857

点赞数 1

文章标签： python 开发语言

于 2022-12-15 23:10:29 首次发布

本文链接：https://blog.csdn.net/cddeer/article/details/128336559

版权

1 encoder = OneHotEncoder()

独热编码问题，例如一个长方体，具有三个属性，长宽高，长1宽2高3，如果编码为[1,2,3]及为标签编码，如果为[100][,010][001]及为独热编码，每一个单元中只能有一个1其余全是0.

2 Y = encoder.fit_transform(Y.reshape(Y.shape[0], 1))

fit(): Method calculates the parameters μ and σ and saves them as internal objects.
解释：简单来说，就是求得训练集X的均值，方差，最大值，最小值,这些训练集X固有的属性。

transform(): Method using these calculated parameters apply the transformation to a particular dataset.
解释：在fit的基础上，进行标准化，降维，归一化等操作（看具体用的是哪个工具，如PCA，StandardScaler等）。

fit_transform(): joins the fit() and transform() method for transformation of dataset.
解释：fit_transform是fit和transform的组合，既包括了训练又包含了转换。
transform()和fit_transform()二者的功能都是对数据进行某种统一处理（比如标准化~N(0,1)，将数据缩放(映射)到某个固定区间，归一化，正则化等）

fit_transform(trainData)对部分数据先拟合fit，找到该part的整体指标，如均值、方差、最大值最小值等等（根据具体转换的目的），然后对该trainData进行转换transform，从而实现数据的标准化、归一化等等。