【python量化】基于ChatGPT的多因子框架实现

最新推荐文章于 2023-10-30 11:16:49 发布

敲代码的quant

最新推荐文章于 2023-10-30 11:16:49 发布

阅读量1.2k

点赞数

文章标签： python pandas 机器学习开发语言人工智能

原文链接：https://mp.weixin.qq.com/s?__biz=MzU3NjY2MDUyMw==&mid=2247490530&idx=1&sn=669f0f87cced9c122f11575f2cba8b56&chksm=fd112ea6ca66a7b00965932cd39d34164308b5d54f2177126d3d84146a717d258aed3e62ddff&scene=126&sessionid=0

版权

史上最强，建议收藏！

尝试用ChatGPT完成量化测试中的常用功能，包括因子构建、因子改进、测试框架，毕竟如果ChatGPT都会算会改进的因子，如果还不会，就只能去搬砖了，就问你慌不慌

除了这里展示的这些，还尝试了一些其他的，包括询问特定基金、股票的信息、求导、积分，甚至解偏微分方程，都能实现。测下来的整体感觉是，除了不能保证准确度，其他都挺好的，但毕竟只是3.5，4已经有了相当程度的提升，以后可能还会有5、6...，相信这会是一个新时代的起点

因子定义及改进

动量因子，代码太长截不下，完整代码放后面了

完整代码如下，有点问题，但问题不大

import datetime
import pandas as pd
from WindPy import w

# 初始化Wind API
w.start()

# 设置起始日期和结束日期
start_date = datetime.date(2022, 3, 1)
end_date = datetime.date(2023, 3, 21)

# 获取股票数据
code = "000001.SZ"
data = w.wsd(code, "close", start_date, end_date, "Fill=Previous")

# 将数据转换为DataFrame
df = pd.DataFrame(data.Data[0], index=data.Times, columns=["close"])

# 计算Momentum指标
df["Mom12_1"] = df["close"].pct_change(periods=12)

# 输出结果
print(df.tail())

反转因子

完整代码附在下面，可以测试一下，甚至会帮忙把因子调整成正向

import numpy as np
import pandas as pd
from datetime import datetime, timedelta
from WindPy import w

# 连接Wind API
w.start()

# 设置计算参数
start_date = datetime.now() - timedelta(days=30) # 计算过去一个月的数据
end_date = datetime.now()
stock_code = '600000.SH'
freq = 'M'
field = 'close'

# 获取股票收盘价数据
raw_data = w.wsd(stock_code, field, start_date, end_date, "")

# 将数据转换为DataFrame格式
df = pd.DataFrame(raw_data.Data[0], index=raw_data.Times, columns=[stock_code])
df = df.resample(freq).last().ffill()

# 计算收益率并标准化
returns = df.pct_change().dropna()
z_scores = (returns - returns.mean()) / returns.std()

# 计算反转因子并排序
rev_factor = -z_scores
rev_factor = rev_factor.dropna().sort_values()

# 输出结果
print(rev_factor)

超预期因子

完整代码如下，不能说完全错误，至少也是毫不相干吧

import datetime
import pandas as pd
from WindPy import w

# 初始化Wind API
w.start()

# 设置起始日期和结束日期
start_date = datetime.date(2022, 3, 1)
end_date = datetime.date(2023, 3, 21)

# 获取股票数据
code = "000001.SZ"
fields = ["eps_basic", "eps_diluted", "oper_rev", "net_profit"]
data = w.wsd(code, fields, start_date, end_date, "Fill=Previous")

# 将数据转换为DataFrame
df = pd.DataFrame(data.Data, index=fields, columns=data.Times).T

# 计算预期收益
df["expected_eps"] = df["oper_rev"] * df["eps_basic"] / df["net_profit"]

# 计算非预期收益
df["unexpected_eps"] = df["eps_basic"] - df["expected_eps"]

# 计算标准化非预期收益（SUE）
df["SUE"] = df["unexpected_eps"].rolling(window=4).std() / df["eps_basic"].rolling(window=4).std()

# 输出结果
print(df.tail())

测试框架

计算IC的函数

分层测试的函数

完整代码如下

import pandas as pd
import numpy as np
import statsmodels.api as sm


def factor_test(factor_data, ret_data, num_groups=5):
    """
    进行因子分层测试
    
    参数：
    factor_data : pandas.DataFrame
        包含因子值的数据框
    ret_data : pandas.DataFrame
        包含股票收益率的数据框
    num_groups : int, 可选（默认值为5）
        分层的组数
    
    返回：
    dict
        包含每个组的平均收益率和t值的字典
    """
    # 确保因子和收益率数据的列名一致
    factor_data.columns = ret_data.columns
    
    # 将因子值标准化为z-score
    factor_data = (factor_data - factor_data.mean()) / factor_data.std()
    
    # 按因子值大小将股票分为不同的组
    groupings = pd.qcut(factor_data, num_groups, labels=False)
    
    # 计算每个组的平均收益率和t值
    group_ret = ret_data.groupby(groupings)
    means = group_ret.mean()
    stds = group_ret.std()
    t_values = means / (stds / np.sqrt(group_ret.count()))
    
    # 返回结果
    return {"mean_returns": means, "t_values": t_values}

事件测试的函数

组合优化的函数

代码如下

import numpy as np
import pandas as pd
from scipy.optimize import minimize

def optimize_portfolio(stocks, start_date, end_date):
    # 获取股票数据
    data = get_stock_data(stocks, start_date, end_date)

    # 计算日收益率和协方差矩阵
    returns = data.pct_change().mean()
    cov_matrix = data.pct_change().cov()

    # 定义优化函数
    def portfolio_variance(weights):
        return np.dot(weights.T, np.dot(cov_matrix, weights))

    # 定义约束条件
    constraints = ({'type': 'eq', 'fun': lambda x: np.sum(x) - 1})

    # 设置初始权重
    num_stocks = len(stocks)
    init_weights = np.array([1.0 / num_stocks] * num_stocks)

    # 最小化方差
    result = minimize(portfolio_variance, init_weights, method='SLSQP',
                      constraints=constraints)

    # 返回最优权重
    return result.x

敲代码的quant

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
【python量化】基于ChatGPT的多因子框架实现

史上最强，建议收藏！尝试用ChatGPT完成量化测试中的常用功能，包括因子构建、因子改进、测试框架，毕竟如果ChatGPT都会算会改进的因子，如果还不会，就只能去搬砖了，就问你慌不慌除了这里展示的这些，还尝试了一些其他的，包括询问特定基金、股票的信息、求导、积分，甚至解偏微分方程，都能实现。测下来的整体感觉是，除了不能保证准确度，其他都挺好的，但毕竟只是3.5，4已经有了相当程度的提升，以后可能还...
复制链接

扫一扫