PCA代码实现

最新推荐文章于 2024-08-05 17:04:33 发布

prince wong

最新推荐文章于 2024-08-05 17:04:33 发布

阅读量261

点赞数

分类专栏：代码库文章标签： python sklearn

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_50007828/article/details/122896693

版权

代码库专栏收录该内容

8 篇文章 1 订阅

订阅专栏

python手动实现

import numpy as np
def pca(X,k):#k is the components you want
  #mean of each feature
  n_samples, n_features = X.shape
  mean=np.array([np.mean(X[:,i]) for i in range(n_features)])
  #normalization
  norm_X=X-mean
  #scatter matrix
  scatter_matrix=np.dot(np.transpose(norm_X),norm_X)
  #Calculate the eigenvectors and eigenvalues
  eig_val, eig_vec = np.linalg.eig(scatter_matrix)
  eig_pairs = [(np.abs(eig_val[i]), eig_vec[:,i]) for i in range(n_features)]
  # sort eig_vec based on eig_val from highest to lowest
  eig_pairs.sort(reverse=True)
  # select the top k eig_vec
  feature=np.array([ele[1] for ele in eig_pairs[:k]])
  #get new data
  data=np.dot(norm_X,np.transpose(feature))
  return data

X = np.array([[-1, 1], [-2, -1], [-3, -2], [1, 1], [2, 1], [3, 2]])

print(pca(X,1))

sklearn实现

from sklearn.decomposition import PCA
import numpy as np
X = np.array([[-1, 1], [-2, -1], [-3, -2], [1, 1], [2, 1], [3, 2]])
pca=PCA(n_components=1)
pca.fit(X)
print(pca.transform(X))

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
PCA代码实现

python手动实现import numpy as npdef pca(X,k):#k is the components you want #mean of each feature n_samples, n_features = X.shape mean=np.array([np.mean(X[:,i]) for i in range(n_features)]) #normalization norm_X=X-mean #scatter matrix scatter_ma
复制链接

扫一扫

专栏目录

prince wong CSDN认证博客专家 CSDN认证企业博客

码龄4年

17: 原创

17万+: 周排名

53万+: 总排名

1万+: 访问

: 等级

207: 积分

342: 粉丝

10: 获赞

14: 评论

46: 收藏

私信

关注

热门文章

分类专栏

代码库 8篇
自动化 2篇
学习笔记 4篇
大数据 7篇

最新评论

解析kml文件，提取经纬度信息存入csv
prince wong: 差不多是这个意思，不同kml写法不太一样，统一替换成一样的格式
解析kml文件，提取经纬度信息存入csv
weixin_56867460: 您好，请问第18、19行中，xmlns=" "，和gx:Track是随着不同的kml需要变么？
python操作excel，汇总n个Excel的内容到一个总表
CSDN-Ada助手: 恭喜你写了第17篇博客！标题看起来很有意思，我对Python操作Excel很感兴趣。汇总n个Excel的内容到一个总表听起来像是一个非常实用的技巧。你的文章内容一定非常详细和有用。接下来，我建议你可以考虑分享一些处理大量数据的技巧，比如如何优化代码以提高处理速度，或者如何处理异常情况。这些对于那些需要在Excel中处理大型数据集的人来说，可能非常有帮助。继续努力创作吧！期待你的下一篇博客。谢谢你分享知识！
时序数据插值，对GPS采样数据进行线性插值
prince wong: 数据理想情况是每秒一个数据点，但很多地方存在丢失，即：1，2，3，6，7，10，11，15。。。这样
时序数据插值，对GPS采样数据进行线性插值
prince wong: 线性。也可以修改kind参数，选择三次样条

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。