量化投资策略与技术学习PART1.1：量化选股之再谈多因子模型（二）

原创

已于 2024-09-07 12:54:56 修改 · 737 阅读

12 ·

CC 4.0 BY-SA版权

文章标签：

#大数据 #人工智能

于 2024-08-31 12:40:39 首次发布

在上一个多因子模型中，我手动对各个因子进行了回测，但是数据结果并不是十分理想，难道基本面指标真的和股票走势关系不大么？
这里我还是准备再测试一下，策略如下：
（1）首先我获取了一下掘金量化终端中可以提供成分股的几个指数代码，同时将衍生指标导入表格中，提取了衍生指标的关键字信息；
（2）总体建立了一个dataframe表格，其中纵坐标表示的是衍生指标，横坐标就是各个指数
（3）我们先选择一个指数，之后提取该指数的成分股，计算该指数N天之后的收益率，同时获得该指数第一个衍生指标数据，之后对一个指数内所有成分股的收益率和衍生指标数据做相关系数计算，并存储到表格中，首先对所有的衍生指标进行循环，之后对所有的指数进行循环，代码如下：

# coding=utf-8
from __future__ import print_function, absolute_import
from gm.api import *
import pandas as pd
import numpy as np
import datetime
import warnings
warnings.simplefilter(action='ignore', category=pd.errors.PerformanceWarning)
"""
函数名：get_finance_deriv_list():
输入参数：null
输出参数：null
函数作用：获取衍生指标与指数成分股之间的相关系数矩阵
"""

def get_finance_deriv_list():
    # dfcf_data = pd.read_csv('2024年8月17日东方财富ETF基金列表去重版 -手动增强.csv')
    dfcf_data = pd.read_csv('掘金投资衍生指标数据CSV.csv')
    finance_deriv = dfcf_data[['字段名', '中文名称']] # 新建一个dataframe表格用于存储需要用到的数据
    return finance_deriv
"""
函数名：finance_deriv_symbol_corr():
输入参数：null
输出参数：finance_deriv 数据类型：dataframe
函数作用：获取衍生指标数据
"""
def finance_deriv_symbol_corr():
    A_share_list = {"SHSE.000010": "SHANG_ZHENG180", "SHSE.000009": "SHANG_ZHENG380", "SHSE.000300": "HU_SHEN300",
                     "SHSE.000905": "ZHONG_ZHENG500", "SHSE.000906": "ZHONG_ZHENG800","SHSE.000852": "ZHONG_ZHENG1000","SHSE.000015":"h

最低0.47元/天解锁文章