回归法选股,是做以下几件事
-
判断因子和股票收益的相关性
-
选择合适的因子
-
整理数据 判断横截面下 上个月的月末,因子对下个月初的股票的影响, 每个月统计一次,用系数表示
-
当我们确定了所有因子对股票的影响后,就可以用回归方程来选择合适的股票,也即判断大盘中股票得分最高的 (沪深300也可以)
所用数学技术:
-
标准化
-
三倍中位数去极值
-
市场中性化
-
主成分分析
下面的代码获取total_data的数据
1 import numpy as np
2 import pandas as pd
3 import datetime
4
5 # 训练回测区间
6 # 准备好因子对应日期的数据 获取每个月月末的数据
7 dates=get_trading_dates(start_date="2008-01-01",end_date="2018-01-01")
8
9 month_date=[]
10 for i in range(len(dates)-1):
11 if dates[i].year!=dates[i+1].year:
12 month_date.append(dates[i])
13 elif dates[i].month!=dates[i+1].month:
14 month_date.append(dates[i])