python基于PCA变换的iris数据分类

from sklearn.datasets import load_iris   #导入数据集
from sklearn.decomposition import PCA    #导入函数库
import matplotlib.pyplot as plt
import numpy as np
iris=load_iris()
pca=PCA(n_components=2)            #设置保留的主成分个数为2
trans_data=pca.fit_transform(iris.data)      #调用fit_transform方法,返回新的数据集
index1=np.where(iris.target==0)
index2=np.where(iris.target==1)
index3=np.where(iris.target==2)
labels=['setosa', 'versicolor', 'virginica']
plt.plot(trans_data[index1][:,0],trans_data[index1][:,1],'r*')
plt.plot(trans_data[index2][:,0],trans_data[index2][:,1],'g*')
plt.plot(trans_data[index3][:,0],trans_data[index3][:,1],'b*')
plt.legend(labels)
plt.show()

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
主成分分析(PCA)是一种常用的维度降低算法,它的主要思想是利用线性变换将高维数据映射到低维空间中。使用PCA算法可以消除高维数据中的冗余、相关信息,从而提高模型训练的效率和准确率。 Python是一种强大的编程语言,拥有丰富的科学计算库和工具。我们可以使用其中的NumPy和Scikit-learn库来实现PCA算法。 首先,需要导入必要的库: ```python import numpy as np from sklearn.datasets import load_iris import matplotlib.pyplot as plt ``` 其中,load_iris函数用于加载鸢尾花数据,返回一个包含样本数据的Bunch对象。 接下来,读取数据并计算协方差矩阵: ```python iris = load_iris() X = iris.data n_samples, n_features = X.shape mean = np.mean(X, axis=0) X_centered = X - mean covariance_matrix = np.cov(X_centered.T) ``` 其中,np.mean函数用于计算样本数据的均值,np.cov函数则用于计算协方差矩阵。 接下来,使用numpy的linalg.eig函数计算协方差矩阵的特征值和特征向量: ```python eigenvalues, eigenvectors = np.linalg.eig(covariance_matrix) ``` 其中,eigenvalues包含了协方差矩阵的特征值,eigenvectors则包含了对应的特征向量。 最后,根据特征值排序并选择前k个特征向量,将样本数据投影到选择出的主成分上: ```python k = 2 idx = eigenvalues.argsort()[::-1][:k] eigenvalues = eigenvalues[idx] eigenvectors = eigenvectors[:,idx] X_pca = np.dot(X_centered, eigenvectors) ``` 其中,argsort函数将特征值从大到小排序,[::-1]则表示逆序,最后选择前k个特征向量。 最后,我们可以使用matplotlib库将降维后的数据可视化: ```python plt.figure() for c, i, target_name in zip("rgb", [0, 1, 2], iris.target_names): plt.scatter(X_pca[iris.target == i, 0], X_pca[iris.target == i, 1], c=c, label=target_name) plt.legend() plt.title('PCA of IRIS dataset') plt.xlabel('PC1') plt.ylabel('PC2') plt.show() ``` 如此便实现了鸢尾花数据PCA算法

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值