中信期货财务因题专题报告:财务因子之单因子测试之因子数据转换(数据标准化)
报告时间:2022-02-09
R语言 Python 量化选股 因子选股 pandas numpy plotly
文章目录
1.数据转换是什么?
数据标准化
数据转换
数据分析强调分析对象的可比性,但不同字段值由于性质、种类或者单位的不同,导致数据之间不可比,容易引起分析结果出现较大误差。
单因子分析、多因子分析中,横截面因子可能影响不大,但是纵截面的误差就会很大。
2.标准化处理
2.1.Z值标准化
剔除异常值后,因子数据标准化处理。Z值标准化。
def standard_zscore(df, factor_list):
"""
因子标准化
"""
for factor in factor_list:
mean = np.mean(df[factor])
std = np.std(df[factor])
df[factor] = (df[factor] - mean) / std
return df
3.实战
数据更新
1.每月中国进出口
1.1.进出口数据 20220531 时间序列 ARMA ARIMA SARIMA
3.3.1 工业产需力量对比:基于工业产出缺口的分析(python&R代码复现)
链接: link
2.宏观数据集
2.1.图01:剔除价格波动后工业增加值同比增速较为平滑_金工狗_数据包
链接: link