写量化策略时常用的技巧

最新推荐文章于 2023-09-01 10:51:12 发布

Xionglingchu

最新推荐文章于 2023-09-01 10:51:12 发布

阅读量2.6k

点赞数

分类专栏： Python Quantitative Strategy 文章标签：股票

本文链接：https://blog.csdn.net/lesleychu/article/details/79340590

版权

本文介绍了在编写量化策略时如何利用Windpy接口创建三维Panel数据。通过先分后合的方法，先处理各个因子的历史序列，然后通过内外层循环构造三维数据。此外，还讨论了Wind API的数据获取限制及其对策略编写的影响，推荐了聚宽作为替代方案。

摘要由CSDN通过智能技术生成

1.善用panel保存数据

说明：pandas有三种数据结构，分别是Series（一维），DataFrame（二维），panel（三维）

例子：沪深300成分股所有股票[stock list]在某些特征指标如成交量、收盘价[indicator list]上的某时间区间内的历史序列[time series]，
[stock list] * [indicator list] * [time series]=3维

Q:如何通过Windpy接口来形成我们的三维面板数据呢？
A：按个股循环，获取每只股票的序列数据（二维）；再把300只个股合并成三维。

例代码1：获取面板原始数据（daily），后期再在这张大的面板数据上计算月度的情况，再排序形成组合。再形成一个新的面板。【思路：总-分-总】

ps1：缺点就是从总表中拆开按每个因子形成月度收益再concat合并，这个过程很麻烦，不如一开始就按因子分开处理好，再合并形成面板数据。

ps2：wind API每天12000条左右的记录限制，意味着300只股票，每天只能他爸爸的获取30天的数据，10年的数据（120个月）得花120天来下载，这很坑啊。。。肯定是要另外想办法的，平时写策略主要目的是训练思路和练手，对数据质量要求不太高，目前看来，聚宽是最好的选择，策略编写平台类似jupyter notebook，也支持python的所有package。

import pandas as pd
import copy
from WindPy import w
import datetime
w.start() 

## 函数getAsharePanels(),获取A股历史面板数据
def getAsharePanels(stockcodes,start_date,end_date):

    append_data=pd.DataFrame(columns=['trade_date','stock_code','open','high','low','close','volume']) #产生一个辅助数据集，帮助后面循环时汇总
    individual_data=pd.DataFrame() #存放个股交易信息的数据集
    result={} #result是一个三维的字典
    for individual_stockcode in stockcodes:

        # 依次生成个股数据集（变量包括：日期、代码、开盘价、最高价、最低价、收盘价、成交量）
        stock=w.wsd(individual_stockcode, "trade_code,open,high,low,close,volume",start_date,end_date)
        individual_data['trade_date']=stock.Times
        individual_data['stock_code']=stock.Data[0]
        individual_data['open']=sto