多因子系列
股票多因子模型学习心得
Jack you123
永远快乐
展开
-
华泰单因子测试之换手率类因子
一、因子选择二、因子收益1)绘制各分位数各周期的平均收益(收益数值不是重点,主要用于观察是否具有单调性)#绘制各分位数各周期的平均收益(收益数值不是重点,主要用于观察是否具有单调性)plot_quantile_returns_bar(by_group=False, demeaned=True, group_adjust=False)2)绘制各分位数的累计收益(收益数值不是重点,看层次是否分明)#绘制各分位数的累计收益(收益数值不是重点,看层次是否分明)w...原创 2020-06-18 15:00:30 · 1307 阅读 · 0 评论 -
华泰单因子测试之成长类因子
一、因子选择原创 2020-06-18 11:13:54 · 585 阅读 · 0 评论 -
华泰单因子测试之波动率类因子
1、考虑行业间差异、不同市值规模间差异行业间差异 :如果存在较大差异,需要做行业中性化处理2、绘制各分位数各周期的平均收益(收益数值不是重点,主要用于观察是否具有单调性。已经知道行业间差异很大,做了中性处理。)...原创 2020-06-17 14:03:39 · 843 阅读 · 0 评论 -
华泰单因子之动量类因子
一、因子选择二、因子收益1)绘制各分位数各周期的平均收益(收益数值不是重点,主要用于观察是否具有单调性)wgt_return_factor.plot_quantile_returns_bar(by_group=False, demeaned=False, group_adjust=False)2)绘制各分位数的累计收益(收益数值不是重点,看层次是否分明)#绘制各分位数的累计收益(收益数值不是重点,看层次是否分明)wgt_return_factor.plot_c...原创 2020-06-12 10:44:07 · 1158 阅读 · 2 评论 -
中证300、500、800成分股调整时间
'''函数get_rng(start_year=None,end_year=None)得到的是每次指数成分股改变时的开始日期在函数get_interval(start_year,end_year)中得到一个完整的周期'''from datetime import datetimedef get_rng(start_year=None,end_year=None): ''' 输入起始结束年份,得到300,500,800指数成分股调整日期。 '''...原创 2020-06-11 16:55:19 · 3356 阅读 · 0 评论 -
华泰单因子测试之估值类因子(回归法)
IC值1、计算每日因子IC值ic_date = pe_factor.calc_factor_information_coefficient(group_adjust=0, by_group=0, method='rank') def calc_factor_information_coefficient(self, group_adjust=False, by...原创 2020-06-09 10:45:07 · 2390 阅读 · 2 评论 -
华泰单因子测试之估值类因子(分层回测)
分层回测'''class FactorAnalyzer(object): def __init__(self, factor, prices, groupby=None, weights=1.0, quantiles=None, bins=None, periods=(1, 5, 10), binn...原创 2020-06-06 17:10:21 · 4838 阅读 · 0 评论 -
华泰单因子测试之估值类因子(因子数据获取分析处理)
华泰单因子测试之估值类因子pb(price-to-earning ratio) 市盈率,PE = 流通市值/最近4个季度的净利润;最近 4 个季度的净利润按如下方法计算: 1-4 月,最近 4 个季度的净利润=上一年度前 3 季度累计净利润+上上一年度的四季度净利润;5-8 月,最近 4 个季度的净利润=当年 1 季度净利润+前 1 年净利润-前 1 年 1 季度净利润;9-10 月,最近 4 个季度的净利润=当年中...原创 2020-05-30 23:24:05 · 2696 阅读 · 0 评论 -
因子数据处理前后比较
一、空值1、 处理前。(存在空值)2、处理后。(不存在空值)二、因子值得整体特征1、处理前2、处理后三、因子值的分布情况1、处理前2、处理后3、概括处理前后因子数值差别很大四、散点图1、处理前因子散点图2、处理后因子散点图五、 柱状图1、处理前因子柱状图2、处理后因子柱状图...原创 2020-06-02 15:25:31 · 387 阅读 · 0 评论 -
原始因子处理之手写标准化函数
一、标准化代码实现(z_score方法标准化)def standardlize(data, inf2nan=True, axis=1): ''' 参数 ----------- data: pd.Series/pd.DataFrame/np.array, 待标准化的序列 inf2nan: 是否将 np.inf 和 -np.inf 替换成 np.nan。默认为 True axis=1: 在 data 为 pd.DataFrame 时使用,如果 ser原创 2020-06-02 13:39:16 · 1072 阅读 · 0 评论 -
原始因子处理之手写去极值函数
一、去极值百分位去极值:直接以上下百分位为边界,将边界外数据归为边界上数据,目前行业内一般不使用。 标准化去极值:又称为标准差法。标准差本身可以体现因子的离散程度,是基于因子的平均值 Xmean而定的。在离群值处理过程中,可通过用 Xmean±nσ来衡量因子与平均值的距离。 标准差法处理的逻辑与MAD法类似,首先计算出因子的平均值与标准差,其次确认参数 n(这里选定 n = 3,3个标准差以内概率为99.73%),从而确认因子值的合理范围为 [Xmean−nσ,Xmean nσ] MAD中位数去极值原创 2020-06-02 13:32:29 · 1089 阅读 · 0 评论 -
原始因子数据分析与处理
1、原始因子数据统计空值情况def detecte_null_value(self,factor_data=None): ''' 统计空值情况 参数 ----------- self.factor : Series 返回值 ----------- null_value_situation : dict 键名:原创 2020-06-01 23:30:57 · 908 阅读 · 0 评论 -
申万一级行业变化
'''申万指数在2014-02-21有一次大改,删除了6个一级行业,并增加了11个一级行业。故:date < 2014-02-21 申万一级行业有23个date = 2014-02-21 申万一级行业有34个date > 2014-02-21 申万一级行业有28个'''#date='2014-02-20',23个code1 = jd.get_industries(name='sw_l1', date='2013-01-20')#date='2014-02-21'有.原创 2020-06-01 14:05:58 · 1837 阅读 · 0 评论 -
jqfactor_analyzer源代码解读02
jqfactor_analyzer单因子分析02首先jqfactor_analyzer源代码解读01中已经得到了self._clean_factor_data(注意binning_by_group参数的使用) ...原创 2020-04-12 21:34:25 · 1055 阅读 · 2 评论 -
jqfactor_analyzer源代码解读01
jqfactor_analyzer单因子分析01前言:去年的时候研究了聚宽上单因子分析的具体过程,现在回顾一下(温故而知新),虽然现在工作主要做的还是研究高频策略,但是下班后还是能够抽出时间来做Alpha因子挖掘。一、原始因子数据处理、去极值、标准化和中性化原始因子处理:首先是得要对因子值有一个...原创 2020-04-08 23:02:44 · 2603 阅读 · 4 评论 -
多因子系列研报对比
做多因子之前大致看了券商写的一些研报,这是之前写过的报告总结,贴出来和大家分享一下。 我先总体看了一下各个券商写的多因子研报,发现多因子需要研究的内容很多,券商根据研究进展分期发布,时间跨度很大。我想的是跟着一个券商的多因子系列研报做下去,目前找到了3家比...转载 2020-01-19 15:39:54 · 1336 阅读 · 2 评论 -
量化交易主流框架介绍
量化交易主流框架介绍ta...转载 2020-01-19 15:35:40 · 3035 阅读 · 0 评论