量化选股之因子选股

最新推荐文章于 2025-03-06 08:06:00 发布

sijiangLu

最新推荐文章于 2025-03-06 08:06:00 发布

阅读量5.4k

点赞数

量化选股之因子选股（仅供参考，大牛轻拍）

一、定义和思想

因子选股模型是应用最为广泛的一种选股模型，基本原理是采用某个或某些因子作为选股的标准，满足这些因子的股票则被买入，不满足的则卖出。

因子选股模型为什么适用？举一个简单的例子：如果有一批人参加马拉松，想知道哪些人能获得不错的成绩，只需在跑前做一个身体测试即可。测试可以用一个或多个指标。对测试的结果进行排名，排名靠前的运动员获得好成绩的可能性就比较大。因子选股模型的原理与此类似，可以利用某些指标（因子）选择未来可能表现较好的股票。

二、因子的种类

哪些因子可能成为选择股票的依据？这主要依赖于金融经济逻辑和市场经验。总的来说，因子的来源有三方面：1）公司层面因子；2）外部环境因子；3）市场表现因子。

（一）公司层面因子

公司层面因子来自于公司的微观结构，与公司的生产经营息息相关，一般来自公司的财务指标，反映了公司的盈利、运营、债务和成长状况。这些因子主要有：1）价值类因子，如PE、PB；2）成长类因子，如ROE、净利润增长率；3）规模类因子，如净利润、营业收入；4）情绪类因子，如预测未来12个月的利润增长率；5）质量类因子，如资产负债率、应收账款周转率。

（二）外部环境因子

政治法律、宏观经济、社会习俗和技术发展等外部环境对一个行业和企业来说都是非常重要的。比较重要并且容易量化的外部环境因子主要是1）宏观环境因子，如经济增长率、利率等；2）行业环境，如行业集中度等。

（三）市场表现因子

市场表现因子主要体现的是股票在交易过程中的价格和交易量。这些因子主要有动量和反转类因子、资金流向和各种技术类指标等。

三、建模方法

因子选股模型想法比较简单，几乎用不到特别复杂的数学模型。如果从数

学的角度来看，因子选股模型仅仅是一个从因子到资金曲线的映射：

f(factors，parameters)=equity

其中f表示交易系统（线性或非线性），实际建模时可以用回归法或打分法进行简化处理。Factors是我们筛选出来的一些有效因子，如果这些因子有信息重叠，可以采用多元统计中的主成分分析或因子分析进行降维处理。Parameters是建模时遇到的各种参数，它们包括因子的权重、观察时间长度和持有时间长度等。Equity是资金曲线，它反映我们账户随时间的变化情况。通过对资金曲线equity的一些再处理，就可以得到一些评价指标（如年化收益率、年化夏普比率和最大回撤等），通过这些指标可以来评价该投资策略的效果。

从上面的模型可以可以看出，因子选股模型最重要的有两方面：一个是有效因子的选择，另一个是因子参数的选择。例如到底是PE有效还是ROE有效；到底是采用1个月做调仓周期还是3个月做调仓周期。这些因子和参数的获取只能通过历史数据的回测来获得。

四、模型回测

模型回测的目的是为了获得有效因子和参数，再利用这些有效因子和参数筛选股票，然后构造投资组合进行投资，从而获得正的alpha收益。

总体来说，模型的回测可以分下面几个步骤进行（具体的细节只有在做的时候才能感受到）。

第一步，数据的准备。这一步主要包括数据时间段的选择、从数据库导出数据以及数据结构的的设计。

第二步，样本的筛选。为了使模型的有效性更强，我们需要对样本进行一些筛选。如剔除选股日的ST/PT股票、剔除新股和剔除由于停牌而无法买入的股票。

第三步，数据清洗。数据清洗主要是对异常值和缺失值进行处理。

第四步，分析计算。这一步是整个回测过程的核心，它涉及到是否标准化、参数的选择、是否考虑交易成本和结果计算等等非常重要的问题。

五、撰写研究报告

可以模仿一些比较好的数量分析报告撰写我们的研究报告。

参考资料

[1]无名.《多因子选股模型》