python随机划分数据集五份_使用python+sklearn实现Iris数据集的PCA示例

最新推荐文章于 2022-03-17 13:47:33 发布

美的时光

最新推荐文章于 2022-03-17 13:47:33 发布

阅读量315

点赞数

文章标签： python随机划分数据集五份

本文链接：https://blog.csdn.net/weixin_42353996/article/details/112274064

版权

本文将主成分分析(Principal Component Analysis)应用于Iris 数据集。

有关此数据集的详细信息，请参见此处。

print(__doc__)# 代码来源：Gaël Varoquaux# 许可证：BSD 3 clauseimport numpy as npimport matplotlib.pyplot as pltfrom mpl_toolkits.mplot3d import Axes3Dfrom sklearn import decompositionfrom sklearn import datasets
np.random.seed(5)
centers = [[1, 1], [-1, -1], [1, -1]]
iris = datasets.load_iris()
X = iris.data
y = iris.target
fig = plt.figure(1, figsize=(4, 3))
plt.clf()
ax = Axes3D(fig, rect=[0, 0, .95, 1], elev=48, azim=134)
plt.cla()
pca = decomposition.PCA(n_components=3)
pca.fit(X)
X = pca.transform(X)for name, label in [('Setosa', 0), ('Versicolour', 1), ('Virginica', 2)]:
    ax.text3D(X[y == label, 0].mean(),
              X[y == label, 1].mean() + 1.5,
              X[y == label, 2].mean(), name,
              horizontalalignment='center',
              bbox=dict(alpha=.5, edgecolor='w', facecolor='w'))# 重新排序标签，使得颜色与聚类结果相匹配
y = np.choose(y, [1, 2, 0]).astype(np.float)
ax.scatter(X[:, 0], X[:, 1], X[:, 2], c=y, cmap=plt.cm.nipy_spectral,
           edgecolor='k')
ax.w_xaxis.set_ticklabels([])
ax.w_yaxis.set_ticklabels([])
ax.w_zaxis.set_ticklabels([])
plt.show()

脚本的总运行时间：( 0 分 0.338 秒) 估计的内存使用量： 8 MB

由Sphinx-Gallery生成的画廊

下载python源代码:plot_ica_vs_pca.py

下载Jupyter notebook源代码:plot_ica_vs_pca.ipynb

☆☆☆为方便大家查阅，小编已将scikit-learn学习路线专栏文章统一整理到公众号底部菜单栏，同步更新中，关注公众号，点击左下方“系列文章”，如图：

欢迎大家和我一起沿着scikit-learn文档这条路线，一起巩固机器学习算法基础。(添加微信：mthler，备注：sklearn学习，一起进【sklearn机器学习进步群】开启打怪升级的学习之旅。) ‍

‍

美的时光

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
python随机划分数据集五份_使用python+sklearn实现Iris数据集的PCA示例

本文将主成分分析(Principal Component Analysis)应用于Iris 数据集。有关此数据集的详细信息，请参见此处。sphx_glr_plot_pca_iris_001print(__doc__)#代码来源：Gaël Varoquaux#许可证：BSD 3 clauseimportnumpyasnpimportmatplotlib.pyplotaspl...
复制链接

扫一扫