时间序列问题上的可解释机器学习的benchmark方法

今天这篇文章介绍一篇机器学习可解释的文章,该篇文章主要提出了一种时间序列问题上的机器学习可解释方法的benchmark。文章链接:

https://arxiv.org/abs/2010.13924

在这里插入图片描述
虽然目前可解释方法研究不成熟,但本篇文章我个人觉得还是比较有意思的,值得一看。由于本人在可解释机器学习上积累不多,文章读起来有些吃力,文章中对目前一些可解释方法的分析部分比较难理解(很多地方我也是带着猜测理解的),但文章的核心方法很好理解。后文将会介绍本人对这篇文章的理解,可能会与原文内容有所偏差,敬请谅解。

1 机器学习可解释重要性

目前在很多领域中机器学习深度学习已经应用的非常广泛了。但在量化投资、风控等领域,对机器学习的应用一直保持着谨慎的态度,其主要原因还是人无法理解较为复杂的机器学习模型。

我在刚开始研究量化时,对于风控的理解就不深,总以为只要回测表现的很好,就可以上实盘或模拟盘检验你的模型。我自己也试验过几个模型,有一些模型跑了一段时间表现很差,这也让我很困惑为什么回测表现还可以,模拟盘表现的这么差。随着对量化的深入研究,我越来越意识到在上模拟盘之前我们需要去理解你的模型买卖逻辑是怎么样的。这样能够减少检验次数,除此之外一旦出现实盘或者模拟盘表现不好你就会知道这种情况是正常的回撤还是模型已经失效,也能根据对市场的理解调整一个模型。

一个好的可解释机器学习的模型可以帮助你更好的理解你的模型在决策时更关注哪些特征,而你在这理解的过程中也会明白你的模型买卖逻辑,也能根据这个买卖逻辑去优化你的模型。这个买卖逻辑也能增强你对交易的理解,我现在越发觉得想做好量化交易,自己得会交易!

总而言之,对于机器学习的可解释是非常有必要的。

2 一些背景知识

Saliency Methods(可解释机器学习的方法)主要可以分为三类,一类是基于梯度的方法,另一类就是基于扰动的方法,还有一类是主要是以shap计算为主的方法。

1)基于梯度的方法(Gradient-based)

其主要的原理是对输入的特征做梯度。这里举个简单的例子

  • 3
    点赞
  • 9
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值