scikit-learn机器学习分析股票板块数据（KMeans,PCA,参数选择）

VFAing

已于 2022-05-09 05:00:35 修改

阅读量2k

点赞数

文章标签： scikit-learn sklearn 人工智能聚类机器学习

于 2022-05-09 04:58:02 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/VFAing/article/details/124651947

版权

本文探讨了使用scikit-learn库在股票板块数据上的PCA和KMeans聚类分析。PCA实践中，通过碎石图选择了4个主成分。KMeans聚类个数选择上，Elbow Method、Silhouette Analysis和UMAP可视化给出了2、3、4个类别的建议，数据本身的特性导致聚类不明确。

摘要由CSDN通过智能技术生成

本文SPSSAU上的分析结果

本文notebok下载

根据软件板块数据，考虑类别时可以使用kmeans等分类算法，而不考虑分类则可以使用pca类算法查看主要成分。本次项目涉及到下图中的两个板块，下次文章再去涉及下图其他两个板块。

PCA算法实践与主成分个数选择

主成分分析之前查看相关性，剔除相关性高的项，可以提高主成分分析有效性。本数据中多重共线性不严重，不用剔除数据。

最低0.47元/天解锁文章

关注

0
点赞
踩
11

收藏

觉得还不错? 一键收藏
0
评论
scikit-learn机器学习分析股票板块数据（KMeans,PCA,参数选择）

本文notebok下载根据软件板块数据，考虑类别时可以使用kmeans等分类算法，而不考虑分类则可以使用pca类算法查看主要成分。本次项目涉及到下图中的两个板块，下次文章再去涉及下图其他两个板块。PCA算法实践与主成分个数选择主成分分析之前查看相关性，剔除相关性高的项，可以提高主成分分析有效性。本数据中多重共线性不严重，不用剔除数据。数据应用于算法前先做缺失值和标准化处理。准备好pipeline:将数据预处理pipeline应用于数据。为了选择出pca合适的主成分个数
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。