机器学习--基于主成分分析（PCA)的优质股票推荐

最新推荐文章于 2024-07-16 15:24:42 发布

刘同敏

最新推荐文章于 2024-07-16 15:24:42 发布

阅读量1.2k

点赞数 1

文章标签：机器学习人工智能

本文链接：https://blog.csdn.net/qq475225253/article/details/131094931

版权

文章介绍了如何利用PCA（主成分分析）从大量的股票中挑选优质股。PCA用于处理数据的相关性，通过转换生成无关联的新特征，保留主要信息。文章提供了获取股票数据的Python代码，涉及Tushare库，以及数据预处理和集成步骤。通过PCA计算综合得分，对股票进行排名，以辅助投资决策。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

一、背景

在证券市场股票很多，就比如在我们国内某证券市场就有三千多只股票，那如何作为一个新手，我们如何从这三千多只股票中选出几只优质股票进行投资呢？如果我们一个一个的去了解每只股票对应公司的资产，营收情况等情况显然很费事，并且不容易综合比较出优质股。那么这时就计算机帮忙，帮我们选出优质股票。具体怎么帮呢？这就涉及到了我们今天要说的内容PCA优质股票推荐

二、主成分分析PCA原理

主成分分析PCA本质是用来选取主要成分的，即主要特征的。并不是用来做优质股票选取的。那我们如何就使用PCA来完成优质股票推荐呢？

1.PCA作用

我们拿到一堆预先处理好的数据（即做过空值填充，分布不平衡处理等）后，首先取其中与我们特定任务有关的一部分字段（即部分数据，如：X1，X2，X3，X4），这些数据之间可能存在着相关性，即数据之间存在着内部联系。那么这些字段我们是不能直接拿来用的，要先去掉他们的相关性。那如何去掉这些相关性呢？常见的一种手段就是PCA

PCA的思路是保持特征尽量不变(主体成分，这里一般指方差)的情况下，用一些不存在相关性的字段（Y1，Y2，Y3)代替原来的字段(X1，X2，X3，X4）。其中Y1，Y2，Y3保留的特征（即方差）依次从大到小。在大多数情况下，原来可能一百多个字段X，PCA分析后，只需要几个字段Y就能保留原来大部分的特征。

那怎么就能使用PCA来做排名呢？比如收入有很多因素构成，原来用X1，X2&