对训练集和测试集的PCA方法

最新推荐文章于 2023-12-30 18:00:15 发布

hellyou

最新推荐文章于 2023-12-30 18:00:15 发布

阅读量4.9k

点赞数 7

分类专栏：杂项文章标签： pca降维机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/hellyou/article/details/110526006

版权

杂项专栏收录该内容

10 篇文章 0 订阅

订阅专栏

假如输入的训练集形状为 $X_{1}\in R^{n_{1} \times m}$
这里 $n_{1}$ 为训练集样本数， $m$ 为数据的原始维度。同理，测试集形状为
$X_{2} \in R^{n_{2}\times m}$
设我们需要的更加紧致的维度为 $k$ ，则需要以下的步骤：

对训练集做均值化，这里是指在每一个维度上计算均值，然后减去均值，即
$average(X_{1}) \in R^{n_{1}}$
$X_{1}^{j} = X_{1}^{j}-average(X_{1}) , j=1,2,...,n_{1}$
求协方差矩阵 $X_{1}^{T}X_{1}/n_{1} \in R^{m\times m}$
对 C 做特征值分解，求出最大的k的特征值，以及对应的k个特征向量。按照降序的方式，把特征向量按列排成一个矩阵 $\in R^{m\times k}$
对训练集和测试集分别乘上P，得到降维后的数据，即
$X_{1}^{'} = X_{1}P\in R^{n{1}\times k}$
$X_{2}^{'} = X_{2}P\in R^{n{1}\times k}$

谨记：只能对训练集降维，把得到的降维矩阵保留，用于对测试集的降维。这是因为，测试集对我们来说，模型生成之前都是不可知的，所以不能使用任何关于测试集的信息。

关注

7
点赞
踩
21

收藏

觉得还不错? 一键收藏
3
评论
对训练集和测试集的PCA方法

假如输入的训练集形状为 X1∈Rn1×m X_{1}\in R^{n_{1} \times m}X1∈Rn1×m这里n1n_{1}n1为训练集样本数，mmm为数据的原始维度。同理，测试集形状为X2∈Rn2×mX_{2} \in R^{n_{2}\times m}X2∈Rn2×m设我们需要的更加紧致的维度为kkk，则需要以下的步骤：对谨记：只能对训练集降维，把得到的降维矩阵保留，用于对测试集的降维。这是因为，测试集对我们来说，模型生成之前都是不可知的，所以不能使用任何关于测试集的信息。
复制链接

扫一扫

专栏目录

hellyou CSDN认证博客专家 CSDN认证企业博客

码龄7年

35: 原创

25万+: 周排名

218万+: 总排名

5万+: 访问

: 等级

730: 积分

7: 粉丝

36: 获赞

17: 评论

127: 收藏

私信

关注

分类专栏

渗透测试
Java 2篇
杂项 10篇
NLP 1篇
python 8篇
操作系统 1篇
数据结构 4篇
算法 8篇
C/C++ 5篇
周志华机器学习 2篇
TCP/IP 1篇

最新评论

Pytorch拓展C++和CUDA：讲解和细节
XD_WT: 报错不允许使用类型名AT_DISPATCH_FLOATING_TYPES怎么解决
KMP算法c++代码
hellyou: 当时啥也不会，其实是按c写的代码，惭愧惭愧
KMP算法c++代码
 扬帆远航: 谢谢作者大大的代码，但最后几句的printf应该是cout对吧
Pytorch自定义数据集 ImageNet
qq_39125740: 你好，你的cls_index.npy能看下是什么样子的么
StochasticPooling 随机池化的PyTorch实现
西西弗斯42: 博主你好，我在尝试使用您的代码遇到了以下问题： File "/home/BadSeedX/202211/1114/convnext.py", line 153, in forward idx = torch.distributions.Multinomial(1, pij).sample().reshape(b, c, 2, 2) File "/home/BadSeedX/miniconda3/envs/Pytorch/lib/python3.7/site-packages/torch/distributions/multinomial.py", line 61, in __init__ self._categorical = Categorical(probs=probs, logits=logits) File "/home/BadSeedX/miniconda3/envs/Pytorch/lib/python3.7/site-packages/torch/distributions/categorical.py", line 64, in __init__ super(Categorical, self).__init__(batch_shape, validate_args=validate_args) File "/home/BadSeedX/miniconda3/envs/Pytorch/lib/python3.7/site-packages/torch/distributions/distribution.py", line 56, in __init__ f"Expected parameter {param} " ValueError: Expected parameter probs (Tensor of shape (2, 1536, 4)) of distribution Categorical(probs: torch.Size([2, 1536, 4])) to satisfy the constraint Simplex(), but found invalid values: 暂时没有什么解决的头绪，请问您可以提供一点建议吗？

最新文章

目录

评论 3

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。