Advance Finance Machine Learning读书笔记
版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA版权协议,转载请附上原文出处链接和本声明。
因为年初疫情影响,书剩在别的地方无法出门取,AFML所以断更了很久,现在持续更新中……
之前有搜到大神weixin_38753422的AFML系列。写得很详细并且有代码和图片解释,链接在此
此系列从Part 1 Chapter 3开始写起,Chapter3之前内容可以在上面的链接里看到。(注意并不是所有内容的整理,而是我个人觉得需要整理的内容)
本文讲的时Part 3 Chapter 14 &15 Backtest Statistics & Understanding Strategy Risk
评价策略
前几章内容记录了进行回测的三种不同方法
- 前向回测法
- CPCV法
- 人造数据法
这一章主要记录的是有哪些可以给策略进行评估的指标
以下是一些指标的罗列:
- 时间跨度:我们的回测时间长度应该做到尽可能地长,囊括住所有的情况
- 平均AUM:AUM(Asset Under Management)平均持仓量, 持 仓 金 额 持 仓 标 的 物 的 数 量 \frac{持仓金额}{持仓标的物的数量} 持仓标的物的数量持仓金额
- 平均容量:最小AUM指的是能满足最基本的持仓和风险控制的需求、但是随着AUM的上升,交易成本就会不断上升,平均容量就是指该策略能达到的最优风险控制下的最大AUM
- 杠杆:这个没啥好解释的吧
- 最大持仓量:策略给出的Bet金额的最大量,建议是接近于平均AUM,给出的越大表明策略越倾向学习到了特殊事件(异常值)
- 多头仓位:在一个多空中立的策略中,多头仓位应该接近于0.5,如果偏离比较严重,回测结果可能于实际投入结果相差较远
- 交易频率:这个不解释了
- 平均持仓时间:高频策略这个值会低,低频策略这个值会高
- 年化成交量: 年 度 交 易 的 金 额 年 度 平 均 A U M \frac{年度交易的金额}{年度平均AUM} 年度平均AUM年度交易的金额
- 与指数的相关程度:如果你的收益与大盘收益的有高度相关,那么你的策略并没有多大的价值
评价指标:
- PnL:策略在回测数据上的总收益
- 多头PnL:策略的多头收益,可以用户检测策略在多空方向上的偏差
- 年化收益:不解释
- Hit比例:Bet最终是 正PnL 占总Bet数的比例
- Hit收益:在Hit bet中所产生的收益
- 策略损失:在非Hit Bet 中所产生的亏损
总收益是指变现了的或者未变现的账面收益,包括应计利息,已付息票和交易期间的股息
了解你的策略风险
每个策略都有它自己的止盈止损的点位,即使你的策略不设置止损的点位,那跌到需要交保证金的时候就是止损位了。所以一个策略总有它的两个退出位。
对称成本
假设你的策略每年会执行 n n n 个服从 I I D IID IID 的bet,那每个bet我们可以用 X i , i ∈ [ 1 , n ] X_i, i\in[1,n] Xi,i∈[1,n]来表示
正收益的bet表示为:收益 π > 0 \pi >0 π>0 机率 P [ X i = π ] = p P[X_i = \pi] = p P[Xi=π]=p
负收益的bet表示为:收益 π < 0 \pi <0 π<0 机率 P [ X i = − π ] = 1 − p P[X_i = -\pi] = 1 - p P[Xi=−π]=1−p
p p p 是模型预测的二分类结果的probability
真正例会获得正收益
假正例会负收益
真负例与假负例都会Pass,不会产生bet
因为每个bet之间都是相互独立的,所以
收益的期望是 E [ X i ] = π p + ( − π ) ( 1 − p ) = π ( 2 p − 1 ) E[X_i]=\pi p+(-\pi)(1-p)=\pi(2p-1) E[Xi]=πp+(−π)(1−p)=π(2p−1)
收益的方差是 V [ X i ] = E [ X i 2 ] − E [ X i ] 2 = 4 π 2 p ( 1 − p ) V[X_i]=E[X_i^2]-E[X_i]^2=4\pi^2 p(1-p) V[Xi]=E[Xi2]−E[X