【book】AMLF-ch1

去年阅读了2018年出版的《Advances in Financial Machine Learning》,推荐给大家,是一本很不错的Fintech实用指导书。
读完很有收获,每章提到的问题都是真实场景中面临的,为我当时做的项目提供了一些思路和指导。这个月准备读完之前没看的章节,更新一下笔记。

推荐语:本书被认为是有史以来有关金融和机器学习的最佳书籍,由马克斯·洛佩兹教授撰写,他在机器学习算法和超级计算机的帮助下开发投资策略已有20多年的经验。这本书揭开了整个领域的神秘面纱,并揭示了投资领域的前沿机器学习技术。本书循序渐进地明确了目标,使读者迅速掌握了经过充分验证的数据分析,模型研究和发现评估方法。
(引用自深度学习于NLP:机器学习从业者人手必备的8本书)

今天的笔记介绍这本书的第一章,第一章主要介绍了书本组织结构,系统地说明了用机器学习做金融问题需要考虑的方方面面,尤其是对于不太了解量化的人来说,是很有必要看一下的。

1. 本书目录和大致结构

首先看一下这本书的目录:
Part 1: Data Analysis
在这里插入图片描述

Part 2: Modelling在这里插入图片描述

Part 3: Backtesting在这里插入图片描述

Part 4: Useful Financial Features在这里插入图片描述

Part 5: High-Performance Computing Recipes在这里插入图片描述

  • 第1部分-金融数据:以适合机器学习的方式构造金融数据。
  • 第2部分-ML算法:讨论如何使用ML算法进行研究。
  • 第3部分-策略回测:如何回测结果并评估它是错误的概率。

这三个部分介绍了数据→模型→评价的整个过程。

  • 第4部分-特征提取:介绍提取有用特性的新方法。
  • 第5部分-算力问题:用一些有用的HPC方法解决需要大量算力的问题。

2. 从原始数据到策略上线需要哪些步骤?

一个投资公司通常包括以下6个部门,也是我们拿到一组原始金融数据到策略实盘上线所需要的大致流程。

数据准备

这是一个负责收集、清理、索引、存储、调整和传送数据的工作站。数据可以是表格式的或分层的、对齐的或不对齐的、历史的或实时的等等。团队成员是市场微观结构和数据协议(如FIX)方面的专家。他们必须开发数据处理程序来理解数据。

例如,一个报价是在不同的级别被取消和替换,还是被取消而没有替换?每种资产类别都有自己的细微差别。
例如,债券定期交换或回收;股票受分拆、逆分拆、表决权等;期货和期权必须滚动;货币不是在一个集中的订单簿中交易的。

这部分涉及的专业化程度超出了这本书的范围,第1章将只讨论数据管理的几个方面。

特征因子

负责把原始数据处理成信号(俗称挖因子、找alpha),这些信息信号对金融变量有一定的预测能力。团队成员是信息理论、信号提取和处理、可视化、标记、加权、分类器和特征重要性技术方面的专家。

例如,特征分析师可能会发现,当下列情况发生时,抛售的可能性特别高:
(1)报价被取消,并新来了市场卖单;
(2)未报价的订单被取消,取而代之的是帐面更深的限价买单。

这种投资策略本身并不是一种投资策略,它可以有其他的应用方式࿱

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值