研报复现:期货截面遗传算法因子挖掘 | 创业板布林带策略(年化13.2%)

原创文章第621篇,专注“AI量化投资、世界运行的规律、个人成长与财富自由"。

这篇研报,已经在星球同步,代码(明天周五)提交

图片

原研报是自己改进了gplearn,我使用deap框架来做

1、整理41支期货的主连合约数据:

图片

2、函数算子实现:

图片

图片

算子分为几类:

一元非滑动类,这类最简单,直接使用np的函数就可以了,代码在expr_unary.py里。

然后一元滑动类的函数很多——主要都是时间序列滑动窗口(rolling)的统计类,比如均值,中位数,偏度,峰度,最大,最小值,排序等等。

import numpy as np
import pandas as pd
from .expr_utils import calc_by_symbol, calc_by_date


@calc_by_symbol
def ts_delay(se: pd.Series, periods=5):  # 滞后N天的序列
    return se.shift(periods=periods)


@calc_by_symbol
def ts_delta(se: pd.Series, periods=20):  # 当前序列与滞后N天之差
    se_result = se - se.shift(periods=periods)
    return se_result


@calc_by_symbol
def ts_mean(se: pd.Series, d):
    return se.rolling(window=d).mean()


@calc_by_symbol
def ts_median(se: pd.Series, d):
    return se.rolling(window=d).median()


@calc_by_symbol
def ts_pct_change(se: pd.Series, N):
    return se / se.shift(N) - 1


@calc_by_symbol
def ts_max(se: pd.Series, periods=5):
    return se.rolling(window=periods).max()


@calc_by_symbol
def ts_min(se: pd.Series, periods=5):
    return se.rolling(window=periods).min()


@calc_by_symbol
def ts_maxmin(X, d):
    return (X - ts_min(X, d)) / (ts_max(X, d) - ts_min(X, d))


@calc_by_symbol
def ts_sum(se: pd.Series, N):
    ret = se.rolling(N).sum()
    return ret


@calc_by_symbol
def ts_std(se, periods=5):
    return se.rolling(window=periods).std()


@calc_by_symbol
def ts_skew(X, d):
    return X.rolling(window=d).skew()


@calc_by_symbol
def ts_kurt(X, d):
    return X.rolling(window=d).kurt()


@calc_by_symbol
def ts_argmin(se: pd.Series, periods=5):
    return se.rolling(periods, min_periods=2).apply(lambda x: x.argmin())


@calc_by_symbol
def ts_argmax(se: pd.Series, periods=5):
    return se.rolling(periods, min_periods=2).apply(lambda x: x.argmax())


@calc_by_symbol
def ts_argmaxmin(X, d):
    return ts_argmax(X, d) - ts_argmin(X, d)


@calc_by_symbol
def ts_rank(se: pd.Series, periods=9):
    ret = se.rolling(window=periods).rank(pct=True)
    return ret

# @calc_by_symbol
# def ts_product(se: pd.Series, d):
#     return se.rolling(window=d).apply(np.product)
#
#

迭代结果:

图片

写了个notebook在这里:

图片

最终挖掘出来的因子如下图示(大家可以自行增减算子函数):

图片

代码下载:AI量化实验室——2024量化投资的星辰大海

01 每日策略

今天我们来配置一个经典的策略——创业板布林带策略

我们实现两个指标:布林带上下轨,使用内置的函数bbands_up(close,20), bbands_down(close,20)即可。

然后交易信号分别为:bbands_up>close, close<bbands_down。

已经发布到服务器:

图片

图片

03 Deap因子挖掘——单因子分析

Alpha5的因子表达式为ts_dema(ts_median(ts_cov(open, volume,21),21),15),它同样可以归属为量价相关性类因子。

它描述了开盘价与成交量的相关性中枢的移动平均水平。

图片

按研报的计算,是得不到相应的结果的:

没有单调性

图片

图片

IC值是负向的,但IC不显著:

图片

而且,你换个时间区间,得出的结果差异性会很大,比如你从20100101来始算,或者结束时间算到当下最新,结果都会不一样。

——金融量化,并不是一门严格的科学。

历史文章:

看《逆行人生》,你应该了解的财务安全与财务自由逻辑

长期年化收益45.9%:兼顾高成长与低波动的趋势轮动策略(附python代码)

AI量化实验室——2024量化投资的星辰大海

### 回答1: "sql_calc_found_rows" 是一个 MySQL 查询选项,它告诉 MySQL 在执行查询时,同时计算查询结果集中的行数,并将结果集的行数存储在一个系统变量中。这个选项通常用于优化分页查询,因为它可以避免在两个查询中重复扫描相同的结果集。 在使用 "sql_calc_found_rows" 选项时,查询结果将包括所有符合条件的行,而不是只返回满足 LIMIT 子句限制的行。因此,在使用此选项时,LIMIT 子句实际上只是用来限制返回结果的数量,而不是限制扫描的行数。 需要注意的是,启用 "sql_calc_found_rows" 选项可能会导致查询的性能下降,因为 MySQL 在计算行数时需要额外的计算资源。因此,如果你只需要查询结果集的行数,而不需要返回所有的行,请考虑使用 COUNT() 函数来计算行数。`sql_calc_found_rows` 是一个 MySQL 数据库系统中的查询选项,用于在执行 SQL 查询时同时计算满足查询条件的总行数。 当你在执行一个有 `sql_calc_found_rows` 选项的查询时,MySQL 会执行两个查询,第一个查询是你实际想要的结果集查询,第二个查询是在没有限制条件的情况下返回结果集的行数。 通过这种方式,`sql_calc_found_rows` 选项能够让你在同一次查询中获得结果集和结果集行数的信息。这个选项对于分页显示查询结果、优化查询性能等场景都有一定的作用。 我可以给你一些关于SQL_calc_found_rows的基本信息:SQL_calc_found_rows是用于检索结果集中行数的MySQL函数。它可以帮助程序员计算查询中符合条件的行数,而不需要检索所有的行。sql_calc_found_rows是一个MySQL查询选项,用于在SELECT查询时计算符合条件的行数,而不是返回查询结果。 如果在SELECT查询中使用了sql_calc_found_rows选项,MySQL将在查询执行时计算符合条件的行数,并将其存储在一个特殊的变量中。这个变量可以通过一个单独的SELECT语句来访问,例如SELECT FOUND_ROWS()。 使用sql_calc_found_rows选项可以方便地获取符合条件的行数,而不需要再次执行查询。这对于需要进行分页或其他涉及行数的操作非常有用。`SQL_CALC_FOUND_ROWS`是一个MySQL的查询修饰符,它用于在执行有`LIMIT`语句的查询时,获取满足条件的总行数。具体来说,当查询包含`SQL_CALC_FOUND_ROWS`修饰符时,MySQL会在不考虑`LIMIT`语句限制的情况下执行查询,然后返回满足条件的总行数,最后再根据`LIMIT`语句返回查询结果的子集。使用`SQL_CALC_FOUND_ROWS`修饰符可以避免额外执行一次查询来获取总行数,从而提高查询效率。sql_calc_found_rows是一个MySQL查询选项,它告诉MySQL在执行SELECT查询时计算匹配的行数,而不是在查询执行后再次执行一条类似的查询以计算结果集的行数。使用这个选项可以提高查询的性能,尤其是在处理大量数据时。在执行SELECT查询后,可以使用SELECT FOUND_ROWS()语句来获取匹配行的实际数目。 我不太懂 SQL_calc_found_rows 这个术语,但我可以尝试回答您的问题。`sql_calc_found_rows`是一个MySQL的查询选项,它可以在执行查询时计算满足条件的总行数,而不考虑LIMIT限制。通常情况下,MySQL只返回满足条件的行数,但使用`sql_calc_found_rows`选项,MySQL会在查询执行完成后返回一个附加的行数值,表示总共有多少行满足条件。 这个选项通常用于需要分页的查询场景中,可以用它来计算总行数,然后再根据需要的页码和每页的行数进行分页查询。需要注意的是,由于`sql_calc_found_rows`需要额外的计算工作,因此可能会影响查询的性能。sql_calc_found_rows是MySQL数据库中的一个函数或者选项,用于在执行SELECT语句时计算匹配的行数,但不将结果返回给客户端。该选项通常用于在分页查询中计算总共有多少行符合查询条件。 在使用sql_calc_found_rows选项时,执行的SELECT语句会返回一个结果集,其中包含与查询条件匹配的行,但是结果集的行数并不代表实际匹配的行数。如果要获取实际匹配的行数,需要使用SELECT FOUND_ROWS()函数,该函数将返回上一条SELECT语句中实际匹配的行数。sql_calc_found_rows是MySQL中的一个查询选项,它可以在执行SELECT查询时返回符合条件的行数,而不受LIMIT子句限制的影响。 使用sql_calc_found_rows选项后,执行SELECT查询后可以使用SELECT FOUND_ROWS()语句返回符合条件的总行数,包括被LIMIT子句限制的行数。 这个选项在需要对查询结果进行分页时非常有用,可以方便地得到符合条件的总行数,以便进行分页计算。 我不太熟悉SQL_calc_found_rows,但是可以给你一些建议:SQL_calc_found_rows用于统计所有匹配查询条件的行数,而不管LIMIT设置多少行。sql_calc_found_rows是一个MySQL的查询选项,用于计算SELECT语句所匹配的行数,而不管LIMIT子句的存在与否。当使用LIMIT子句限制结果集时,如果需要知道未使用LIMIT子句时查询结果的总行数,可以使用sql_calc_found_rows选项。此选项将在执行查询后,返回一个额外的结果集,其中仅包含匹配行数。需要注意的是,启用sql_calc_found_rows选项可能会对查询性能产生一定的影响。`SQL_CALC_FOUND_ROWS` 是MySQL的一个查询优化特性,它可以在执行SELECT语句时同时返回符合条件的总行数,而不用再次执行一次查询来计算总行数。使用`SQL_CALC_FOUND_ROWS`时,在SELECT查询中必须包含LIMIT语句,否则将会返回整个结果集的总行数。可以使用`SELECT FOUND_ROWS()`语句来获取总行数。"sql_calc_found_rows" 是MySQL的一个查询修饰符,它可以告诉MySQL在执行查询时计算匹配的行数,而不是快速返回匹配的行数。通常情况下,如果不使用"sql_calc_found_rows",MySQL只返回匹配的行数,而不计算实际匹配的行数,这在某些情况下可能会导致问题。 当使用"sql_calc_found_rows"时,MySQL将计算实际匹配的行数,并将其存储在一个内部变量中。可以使用"FOUND_ROWS()"函数来检索这个内部变量中存储的行 这是一种MySQL函数,它用于计算SELECT语句返回的行数,但不会从结果集中删除任何行。`sql_calc_found_rows`是MySQL数据库中的一个选项,用于在执行SELECT查询时计算匹配的行数,而不是返回实际检索到的行数。 具体来说,当使用`SELECT SQL_CALC_FOUND_ROWS ...`语句执行查询时,MySQL会在执行实际查询之前计算匹配的行数,并将其存储在内部状态中。然后,可以使用`SELECT FOUND_ROWS();`语句来检索此计数,而不需要重新执行查询。 例如,假设有一个包含1000行数据的表,执行以下查询: ``` SELECT SQL_CALC_FOUND_ROWS * FROM my_table WHERE some_column = 'some_value'; ``` 如果该查询返回了100行数据,则在执行以上查询后执行以下查询: ``` SELECT FOUND_ROWS(); ``` 将返回结果`100`,而不是`1000`。 使用`sql_calc_found_rows`选项可以更有效地执行某些查询,因为它可以避免在实际查询之前计算总行数。但是,在一些情况下,这个选项可能会来性能问题,因为它需要更多的内存来存储匹配的行数。因此,应该根据具体情况评估使用该选项的效果。 ### 回答2: sql_calc_found_rows是MySQL数据库中的一个特殊关键字。它用于在执行有LIMIT子句的SELECT查询语句时,同时返回查询结果的总行数。 在普通情况下,执行有LIMIT子句的SELECT查询语句时,MySQL只会返回满足条件的指定行数的结果。而使用sql_calc_found_rows关键字后,MySQL会在返回结果时,同时计算并返回满足条件的总行数。 使用sql_calc_found_rows的语法如下: SELECT SQL_CALC_FOUND_ROWS * FROM table_name WHERE conditions LIMIT row_count; 在这个语法中,table_name是要查询的表名,conditions是查询条件,row_count是要返回的行数。 使用了sql_calc_found_rows关键字后,查询的结果集中会多出一行,即是实际满足条件的总行数。为了获取这个总行数,我们可以在查询结束后,使用以下语句进行获取: SELECT FOUND_ROWS(); 执行上述语句后,可以获取到实际满足条件的总行数。 sql_calc_found_rows关键字在一些特定的业务场景中非常有用,比如在分页查询时,我们既需要获取当前页的结果集,又需要知道总共有多少行数据。通过使用sql_calc_found_rows关键字,可以更方便地实现这个需求。 总之,sql_calc_found_rows是MySQL中的一个关键字,用于在执行有LIMIT子句的SELECT查询语句时,同时返回查询结果的总行数。它可以提供更便捷的分页查询功能。 ### 回答3: sql_calc_found_rows是MySQL数据库中的一个函数,用于在执行SELECT查询语句时,同时计算匹配的行数,而无需再次执行查询。这个函数通常与LIMIT子句一起使用,以便在查询结果中返回匹配条件的行数。 使用sql_calc_found_rows函数的语法如下: SELECT sql_calc_found_rows * FROM table_name LIMIT n; 在执行上述查询语句时,MySQL会返回查询结果中匹配条件的行数,并将其保存在特殊变量FOUND_ROWS中。但是,如果不使用sql_calc_found_rows函数,而直接执行SELECT COUNT(*) FROM table_name,MySQL会再次执行一次完整的查询以计算匹配行数,这样会增加数据库的负荷和查询时间。 因此,使用sql_calc_found_rows函数可以提高查询性能,特别是当查询结果需要同时返回匹配行数时。在实际应用中,我们可以在查询需要分页展示时,通过使用LIMIT和sql_calc_found_rows函数来减少查询时间,并确保正确地获得匹配的行数。 需要注意的是,使用sql_calc_found_rows函数对性能有一定的影响,特别是对于大型表和复杂的查询语句。因此,在使用时需要权衡性能和需求,避免不必要的查询,以提高数据库的效率和响应速度。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

AI量化投资实验室

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值