【已解决】ValueError: Found array with dim 4. TSNE expected <= 2.

问题描述


Traceback (most recent call last):
  File "/home/visionx/nickle/temp/SimCLR/linear_evaluation.py", line 229, in <module>
    ).fit_transform(all_nodes_unnormalized_scores)
      ^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
  File "/home/visionx/anaconda3/envs/simclr-pt/lib/python3.11/site-packages/sklearn/utils/_set_output.py", line 157, in wrapped
    data_to_wrap = f(self, X, *args, **kwargs)
                   ^^^^^^^^^^^^^^^^^^^^^^^^^^^
  File "/home/visionx/anaconda3/envs/simclr-pt/lib/python3.11/site-packages/sklearn/base.py", line 1152, in wrapper
    return fit_method(estimator, *args, **kwargs)
           ^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
  File "/home/visionx/anaconda3/envs/simclr-pt/lib/python3.11/site-packages/sklearn/manifold/_t_sne.py", line 1111, in fit_transform
    embedding = self._fit(X)
                ^^^^^^^^^^^^
  File "/home/visionx/anaconda3/envs/simclr-pt/lib/python3.11/site-packages/sklearn/manifold/_t_sne.py", line 841, in _fit
    X = self._validate_data(
        ^^^^^^^^^^^^^^^^^^^^
  File "/home/visionx/anaconda3/envs/simclr-pt/lib/python3.11/site-packages/sklearn/base.py", line 605, in _validate_data
    out = check_array(X, input_name="X", **check_params)
          ^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
  File "/home/visionx/anaconda3/envs/simclr-pt/lib/python3.11/site-packages/sklearn/utils/validation.py", line 951, in check_array
    raise ValueError(
ValueError: Found array with dim 4. TSNE expected <= 2.

解决方法

        1、原因:维度不匹配。数组维度为4维,现在期望的是 <= 2维

        解决思路参考了上面两张图 

        第一步、打印维度

(128, 3, 224, 224)

        第二步、将输入改为二维就可以了
x_i = x_i.reshape(128, -1)
        2、 各参数说明
    tsne = TSNE(perplexity=30, n_components=2, init='pca', n_iter=5000); plot_only = 500 #只画前500个点
                #对中间层输出进行tsne降维
                low_dim_embs = tsne.fit_transform(flat_representation[:plot_only, :])
                #数据经过tsne以后是二维的  
                #画图传递数据二维的,和真实类别
        2.1、sklearn.manifold.TSNE函数定义如下:

        class sklearn.manifold.TSNE(n_components=2, perplexity=30.0, early_exaggeration=4.0, learning_rate=1000.0, n_iter=1000, n_iter_without_progress=30, min_grad_norm=1e-07, metric=‘euclidean’, init=‘random’,verbose=0, random_state=None, method=‘barnes_hut’, angle=0.5)

        2.2、参数:

        n_components:int,可选(默认值:2)嵌入式空间的维度。

        perplexity:浮点型,可选(默认:30)较大的数据集通常需要更大的perplexity。考虑选择一个介于5和50之间的值。由于t-SNE对这个参数非常不敏感,所以选择并不是非常重要。

        early_exaggeration:float,可选(默认值:4.0)这个参数的选择不是非常重要。

learning_rate:float,可选(默认值:1000)学习率可以是一个关键参数。它应该在100到1000之间。如果在初始优化期间成本函数增加,则早期夸大因子或学习率可能太高。如果成本函数陷入局部最小的最小值,则学习速率有时会有所帮助。

        n_iter:int,可选(默认值:1000)优化的最大迭代次数。至少应该200。

n_iter_without_progress:int,可选(默认值:30)在我们中止优化之前,没有进展的最大迭代次数。

        0.17新版​​功能:参数n_iter_without_progress控制停止条件。

        min_grad_norm:float,可选(默认值:1E-7)如果梯度范数低于此阈值,则优化将被中止。

        metric:字符串或可迭代的,可选,计算特征数组中实例之间的距离时使用的度量。如果度量标准是字符串,则它必须是scipy.spatial.distance.pdist为其度量标准参数所允许的选项之一,或者是成对列出的度量标准.PAIRWISE_DISTANCE_FUNCTIONS。如果度量是“预先计算的”,则X被假定为距离矩阵。或者,如果度量标准是可调用函数,则会在每对实例(行)上调用它,并记录结果值。可调用应该从X中获取两个数组作为输入,并返回一个表示它们之间距离的值。默认值是“euclidean”,它被解释为欧氏距离的平方。

        init:字符串,可选(默认值:“random”)嵌入的初始化。可能的选项是“随机”和“pca”。 PCA初始化不能用于预先计算的距离,并且通常比随机初始化更全局稳定。

        random_state:int或RandomState实例或None(默认)
伪随机数发生器种子控制。如果没有,请使用numpy.random单例。请注意,不同的初始化可能会导致成本函数的不同局部最小值。

        method:字符串(默认:‘barnes_hut’)
默认情况下,梯度计算算法使用在O(NlogN)时间内运行的Barnes-Hut近似值。 method ='exact’将运行在O(N ^ 2)时间内较慢但精确的算法上。当最近邻的误差需要好于3%时,应该使用精确的算法。但是,确切的方法无法扩展到数百万个示例。0.17新版​​功能:通过Barnes-Hut近似优化方法。

        angle:float(默认值:0.5)
仅当method ='barnes_hut’时才使用这是Barnes-Hut T-SNE的速度和准确性之间的折衷。 ‘angle’是从一个点测量的远端节点的角度大小(在[3]中称为theta)。如果此大小低于’角度’,则将其用作其中包含的所有点的汇总节点。该方法对0.2-0.8范围内该参数的变化不太敏感。小于0.2的角度会迅速增加计算时间和角度,因此0.8会快速增加误差。
————————————————
版权声明:本文为CSDN博主「陈杉菜」的原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接及本声明。
原文链接:https://blog.csdn.net/qq_44702847/article/details/90044884

完结撒花

        人一旦有了寄托,就很容易忘了自己的梦想

  • 1
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
`MinMaxScaler`是`sklearn.preprocessing`中的标准化类,用于将数据缩放到给定范围内。但是,`MinMaxScaler`只能处理维度为1或2的数组,当输入的数组维度大于2时,就会报错`ValueError: Found array with dim 3. MinMaxScaler expected <= 2.`。 解决这个问题的方法是,将多维数组降维为二维数组,然后使用`MinMaxScaler`进行标准化。具体实现代码如下: ```python from sklearn.preprocessing import MinMaxScaler # 假设输入数据的数组为X n_samples, n_features, n_depth = X.shape X_2d = X.reshape((n_samples, n_features * n_depth)) scaler = MinMaxScaler() X_scaled = scaler.fit_transform(X_2d) # 将标准化后的二维数组再转换回多维数组 X_scaled_3d = X_scaled.reshape((n_samples, n_features, n_depth)) ``` 其中,`reshape`函数将多维数组转换为二维数组,`fit_transform`函数对二维数组进行标准化处理,然后再使用`reshape`函数将标准化后的二维数组转换为多维数组。 需要注意的是,使用`MinMaxScaler`进行标准化时,需要保证训练集和测试集在同一尺度下进行标准化。可以先对训练集进行标准化处理,然后直接使用训练集的标准化器对测试集进行标准化。具体实现如下: ```python n_samples_train, _, _ = X_train.shape n_samples_test, _, _ = X_test.shape X_train_2d = X_train.reshape((n_samples_train, n_features * n_depth)) X_test_2d = X_test.reshape((n_samples_test, n_features * n_depth)) scaler = MinMaxScaler() X_train_scaled = scaler.fit_transform(X_train_2d) X_test_scaled = scaler.transform(X_test_2d) X_train_scaled_3d = X_train_scaled.reshape((n_samples_train, n_features, n_depth)) X_test_scaled_3d = X_test_scaled.reshape((n_samples_test, n_features, n_depth)) ``` 其中,`X_train`和`X_test`分别为训练集和测试集的输入数据,其他变量的含义与之前相同。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值