量化学习小点记录

最新推荐文章于 2024-09-09 22:26:59 发布

wch1989211wch

最新推荐文章于 2024-09-09 22:26:59 发布

阅读量177

点赞数

本文链接：https://blog.csdn.net/wch1989211wch/article/details/84314329

版权

1.波动率问题：

从数理统计的角度来看，普通的线性回归都隐含了一个对原始数据的假设，即“数据的方差近似不变”。
但实际上，因为不同的时期，市场的波动率不一样，所以因变量（收益率）的标准差不一样，自然方差也不一致了

从直观理解的角度来看，市场波动率较高的时候，收益率无论涨跌，数值都比较大，他们对回归系数的影响程度会远大于波动率较低时期的收益率的影响。
如果直接用原始的收益率，会出现回归系数被高波动率数据“绑架”的情况。

一种解决办法是，用收益率的历史标准差作为市场波动率的代理变量，然后用历史标准差对最新的收益率进行标准化（除以标准差）这样得到的数据，在每个时刻的方差就会比较接近了。

但是这种调整方法毕竟是扭曲了真实的数据，我们需要在原始收益率和调整后收益率上面都进行回归分析并检验模型
如果两个收益率得到的模型都揭示了同一个规律，那么这个规律的可信度会比较高

之前我们按照5个交易日为一组，划分了4个虚拟变量：

我们首先猜测最没有特色的是第3个，trade_last_6_10，我们把这个列忽略，并且加上截距项，进行虚拟变量回归并检验模型

result = smf.ols("ret ~ tradeday_first_1_5 + tradeday_first_6_10 + tradeday_last_1_5 + 1", data).fit()
result.summary()
注：这里主要查看T检验，每个变量的显著性

下面再方差分析（方差分析主要考察各个因素的影响情况）

anova_lm(result)

	df	sum_sq	mean_sq	F	PR(>F)
tradeday_first_1_5	1.0	0.003277	0.003277	10.518536	0.001194
tradeday_first_6_10	1.0	0.000314	0.000314	1.008635	0.315305
tradeday_last_1_5	1.0	0.000017	0.000017	0.055801	0.813275
Residual	3254.0	1.013637	0.000312	NaN	NaN