期货量化软件:衡量指标信息

文章探讨了如何使用熵来衡量市场交易策略开发中指标数据的结构和信息含量。熵作为信息理论的一个概念,可以帮助识别哪些指标对于机器学习模型训练更有价值。通过离散化连续变量并计算熵,可以评估指标是否富含重要信息,从而优化模型的预测能力。文章还提供了一个脚本示例,用于计算指标熵,并展示了不同指标的熵值,强调了分布均匀的指标更有利于学习算法。
摘要由CSDN通过智能技术生成

机器学习依靠数据训练来学习市场的一般行为,最终做出相当准确的预测。 所选学习算法必须遍历精心挑选的样本,以便提取有意义的信息。 许多人未能成功应用这些精密工具的原因是,大多数有意义的信息都隐藏在嘈杂的数据当中。 对于许多策略开发人员来说可能并不清楚,他们选取的数据集可能不适合模型训练。

指标可考虑作为针对基础价格序列携带有关信息的提供者。 利用这个前提,熵可以用来衡量指标传达了多少信息。 使用 Timothy Masters 撰写的《测试和优调市场交易系统(TTMTS)》一书中记录的步骤和工具,赫兹期货量化来演示如何使用这些步骤和工具来评估指标数据的结构。

 

为什么要衡量指标信息

通常,在使用机器学习工具进行策略开发时,赫兹期货量化只是简单地将各种数据扔给算法,希望能从中得到一些结果。 最终的成功将取决于模型中所用的预测变量的品质,且有效的预测因子通常具有某种特征。 其中之一充满了重要的信息内容。

在模型训练的变量中信息量很重要,但并不是有效模型训练的唯一要求。 因此,衡量信息内容可在训练过程中筛选盲目选用的指标。

在 赫兹期货量化上撰写有关的文章已有很多次了。 我要向读者们道歉,因为他们将不得不忍受另一个定义,但我保证这对于理解该概念的应用至关重要。 之前的文章已经提供了熵计算的历史和推导,所以为了简洁起见,我们直接从方程开始。

编辑

添加图片注释,不超过 140 字(可选)

H(X) 表示 X 的熵,X 是表示任意变量的离散变量,例如一条消息。 消息的内容只能假定有限数量的值。 这在等式中表示为小写的 x。 小写 x 是消息的观测值,如此,如果 x 的所有可能值都可在一个集合 N 中列举。

研究一个公平骰子的例子。 掷骰子时,可以被视为提供信息,判定游戏的结果。 骰子有 6 条独特的边,编号为 1 到 6。 观察到任何朝上的数字的概率是 1/6。

依此示例,大写 X 是骰子,小写 x 可以是骰子侧面绘制的任何数字。 所有这些都置于集合 N ={ 1,2,3,4,5,6}。 应用公式,这个骰子的熵是 0.7781。

编辑

添加图片注释,不超过 140 字(可选)

现在考虑另一个骰子,它有制造缺陷。 它有 2 个面,上面画

  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值