机器学习与金融
文章平均质量分 89
机器学习与金融
BigQuant
这个作者很懒,什么都没留下…
展开
-
如何对连续型数据进行离散化处理,并进行OneHot编码?
如何对连续型数据进行离散化处理,并进行OneHot编码?原创 2022-11-15 14:51:52 · 1053 阅读 · 0 评论 -
七种量化选股模型
七种量化选股模型【新增策略案例】原创 2022-01-05 14:50:47 · 3140 阅读 · 0 评论 -
机器学习因子:在线性因子模型中捕捉非线性
虽然机器学习(机器学习)算法已经存在了几十年,但最近它们在包括金融在内的许多领域受到了越来越多的关注,尤其是在解释资产回报的应用上。虽然线性因子模型多年来一直是理解风险敞口、风险和投资组合表现的重要工具,但没有哪一种模型是一成不变的,即因子敞口和回报之间的关系必须是线性的。转载 2022-10-17 13:34:10 · 823 阅读 · 0 评论 -
免费学习机器学习交易的资源
机器学习是当今几乎每个行业的需求。医药、交通、医疗保健、广告和金融技术等行业非常依赖机器学习。谈到金融技术领域,算法交易实践对于机器学习算法非常有效。有各种资源可用于学习机器学习交易,但本文旨在让您可以访问学习机器学习交易的免费资源。如何使用机器学习进行交易?, 由量子这本电子书包含所有信息,从解释人工神经网络的基础知识和工作原理,到演示用 Python 实现股票价格预测的代码。可解释的机器学习,Christoph Molnar本书的重点是帮助读者学习表格数据的机器学习模型。...原创 2022-07-13 18:02:55 · 302 阅读 · 0 评论 -
一文读懂遗传算法(附python)
遗传算法 (Genetic Algorithms,简称GA)是人工智能的重要新分支,是基于达尔文进化论,在计算机上模拟生命进化机制而发展起来的一门新学科。它根据适者生存、优胜劣汰等自然进化机制来进行搜索计算和问题求解。本文主要介绍遗传算法的原理,包括其定义及其实现步骤,以及遗传算法的研究现状和未来发展趋势。...转载 2022-07-04 15:41:27 · 556 阅读 · 0 评论 -
机器学习中的无监督学习是什么?
顾名思义,“无监督”学习发生在没有监督者或老师并且学习者自己学习的情况下。例如,考虑一个第一次看到并品尝到苹果的孩子。她记录了水果的颜色、质地、味道和气味。下次她看到一个苹果时,她就知道这个苹果和之前的苹果是相似的物体,因为它们具有非常相似的特征。她知道这和橙子很不一样。但是,她仍然不知道它在人类语言中的名称是什么,即“苹果”,因为不知道这个标签。这种不存在标签(在没有老师的情况下)但学习者仍然可以自己学习模式的学习称为无监督学习。...原创 2022-07-04 14:43:03 · 9289 阅读 · 0 评论 -
2021AI量化投资训练营重磅升级,自带编程的优势显而易见
量化交易规模突破万亿大关国内量化交易规模快速发展,今年量化基金已突破万亿大关,并且量化私募的整体业绩十分亮眼,过去5年一线量化私募的超额收益基本在20%~30%,量化交易的占比已达到20%~30%(BigQuant开第一期培训的时候还不到10%),可见量化的发展迅猛,未来也会以更快地速度占领交易市场。无论是自己投资需要还是进入量化领域学习量化都是不错的选择。关于AI量化投资训练营BigQuant今年的培训比往年来的晚一些,在大家的日益催促下2021AI量第四期化投资训练营正式开班了!今年的课程中新增.原创 2021-09-15 16:43:46 · 553 阅读 · 0 评论 -
深度学习前沿 | 利用GAN预测股价走势
这里写自定义目录标题欢迎使用Markdown编辑器新的改变功能快捷键合理的创建标题,有助于目录的生成如何改变文本的样式插入链接与图片如何插入一段漂亮的代码片生成一个适合你的列表创建一个表格设定内容居中、居左、居右SmartyPants创建一个自定义列表如何创建一个注脚注释也是必不可少的KaTeX数学公式新的甘特图功能,丰富你的文章UML 图表FLowchart流程图导出与导入导出导入欢迎使用Markdown编辑器你好! 这是你第一次使用 Markdown编辑器 所展示的欢迎页。如果你想学习如何使用Mar原创 2021-07-28 14:39:41 · 5187 阅读 · 6 评论 -
利用CNN对股票“图片”进行涨跌分类——一次尝试
首先解释一下标题:CNN:卷积神经网络(Convolutional Neural Network), 在图像处理方面有出色表现,不是被川普怒怼的那个新闻网站;股票涨跌:大家都懂的,呵呵;股票图片:既然使用CNN,那么如果输入数据是股票某个周期的K线图片就太好了。当然,本文中使用的图片并不是在看盘软件上一张一张截下来的,而是利用OHLC数据“画”出来的;尝试:这个词委婉一点说就是“一个很好的想法_",比较直白的说法是“没啥效果T_T”。进入正题:首先是画出图片。本文目前是仿照柱线图画的。大致原创 2020-12-17 14:12:46 · 1179 阅读 · 2 评论 -
如何写好策略——因子篇(二):因子是否越多越好?
在这个模型里的18个因子,难以衡量每个因子的作用。目前有一套shap包,对黑箱有一定的解释性。这个解释原理比较简单,按照添加该因子的顺序观察结果变化。比如添加该因子前和添加因子后,模型输出结果的变化是否发生了变化,结果对模型的敏感度或者贡献度有什么影响,这个可以评判因子对预测值起到了拉高还是降低的作用,进而计算shap值作为评估。BigQuant以后逐步地把这个功能加进来,形成标准化、模块化的产品功能。同时,可以参考一下相关的研报。例如华泰证券有对黑箱模型的解释: Shap包应用、因子之间的相互作用。但对原创 2020-12-05 16:45:39 · 1470 阅读 · 0 评论 -
【干货】开发AI量化策略所遇到的坑
AI只是工具,想要驾驭AI还得自身有点功底,不然反而会被工具所害,甚至从信仰AI变为抵制AI。本文简单介绍开发AI量化选股策略中所遇到的各种坑,希望大家有所收获,少走弯路。本文主要从思想和实操两个层面分享下我在开发AI量化选股策略中所遇到的各种坑,也希望各位小伙伴能够进行补充。策略思想逻辑层面训练集和测试集不能有所重合机器学习的基本思路就是在训练集上发现pattern,训练出模型,然后对样本外的预测集数据进行预测。这好比老师平时布置的作业就是训练集,学生们通过平时的作业学习到知识,然后期末老.原创 2020-12-03 16:10:27 · 2465 阅读 · 1 评论 -
时间加权平均价格算法(TWAP)和成交量平均算法(VWAP)在量化回测的应用
为什么要引入TWAP和 VWAP?为了评估策略的资金容量,我们对M.trade模块里买入点和卖出点这两个参数进行了更丰富的扩展,支持了策略能够按更丰富的算法交易价格(WAP)进行撮合。如果资金是10万的话,那么在开盘买入基本上没有什么问题,如果资金量是300万、或者1000万呢?开盘如果只买入几只股票的话,本身的交易行为就会改变市场状态,冲击成本巨大。因此我们支持了算法交易里TWAP和VWAP。TWAP (Time Weighted Average Price),时间加权平均价格算法,是一种最简单的传原创 2020-12-02 10:50:19 · 8243 阅读 · 0 评论 -
七种量化选股模型
1.多因子模型多因子模型是应用最广泛的一种选股模型,基本原理是采用一系列的因子作为选股标准,满足这些因子的股票则被买入,不满足的则卖出。基本概念举一个简单的例子:如果有一批人参加马拉松,想要知道哪些人会跑到平均成绩之上,那只需在跑前做一个身体测试即可。那些健康指标靠前的运动员,获得超越平均成绩的可能性较大。多因子模型的原理与此类似,我们只要找到那些对企业的收益率最相关的因子即可。各种多因子模型核心的区别第一是在因子的选取上,第二是在如何用多因子综合得到一个最终的判断。一般而言,多因子选股模型有两种原创 2020-12-02 10:10:00 · 7366 阅读 · 0 评论 -
Pandas数据可视化工具——Seaborn用法整理(下)
本文是基于StackAbuse的一篇讲解Seaborn的文章 上编写。 附示例及实现代码,可直接前往文末 一键克隆代码 进行实践研究。在前一篇文章 Pandas数据可视化工具——Seaborn用法整理(上),我们了解了如何使用这些Seaborn代码绘制分布图和分类图。在本文中,我们将继续讨论Seaborn提供的一些其他以绘制不同类型统计图的功能,我们将从矩阵图开始讨论。矩阵图矩阵图是一种以行和列的形式显示数据的图。Heat maps是矩阵图的一个典型例子。Heat MapsHeat Maps通.原创 2020-12-01 17:46:51 · 1103 阅读 · 0 评论 -
机器学习常用算法盘点
本文将带你遍历机器学习领域最受欢迎的算法。系统地了解这些算法有助于进一步掌握机器学习。当然,本文收录的算法并不完全,分类的方式也不唯一。不过,看完这篇文章后,下次再有算法提起,你想不起它长处和用处的可能性就很低了。本文还附有两张算法思维导图供学习使用。在本文中,我将提供两种分类机器学习算法的方法。一是根据学习方式分类,二是根据类似的形式或功能分类。这两种方法都很有用,不过,本文将侧重后者,也就是根据类似的形式或功能分类。在阅读完本文以后,你将会对监督学习中最受欢迎的机器学习算法,以及它们彼此之间的关系有一原创 2020-11-30 18:47:32 · 402 阅读 · 0 评论 -
基于Barra多因子模型的组合权重优化
本篇文章有别于传统的多因子研究,我们并未将重点放在阿尔法因子的挖掘上,而是通过对股票组合的权重优化计算,找到了在市值中性、行业中性、风格因子中性约束下的最优投资组合,以及验证得到的组合权重是否满足了约束条件。结构化多因子风险模型首先对收益率进行简单的线性分解,分解方程中包含四个组成部分:股票收益率、因子暴露、因子收益率和特质因子收益率。那么,第只股票的线性分解如下所示:rj=x1f1+x2f2+x3f3+x4f4⋅⋅⋅⋅xKfK+ujr_j=x_1f_1+x_2f_2+x_3f_3+x_4f_4 ···原创 2020-11-30 18:20:46 · 4340 阅读 · 0 评论 -
基于DNN模型的智能选股策略
1、DNN原理介绍 1.1 神经元 1.2 DNN 1.3 反向传播2、实例:DNN模型选股 2.1 策略步骤和模型参数 2.2 回测结果1. DNN原理介绍1.1 神经元神经网络的每个单元结构如下:图1.神经元结构其对应公式如下:hW,b(x)=f(WTx)=f(∑i=13wixi+b)h_{W,b}(x)=f(W^Tx)=f(\sum_{i=1}^3w_ix_i+b)hW,b(x)=f(WTx)=f(i=1∑3wixi+b)这相当于进行了两步:先计算各项输入的加原创 2020-11-30 18:07:45 · 716 阅读 · 0 评论 -
WorldQuant 101 Alpha因子构建及因子测试
WorldQuant 101alpha因子构建及因子测试背景介绍根据WorldQuant发表的论文《101 Formulaic Alphas 》 ,其中公式化地给出了101个alpha因子。与传统方法不一样的是,他们根据数据挖掘的方法构建了101个alpha,据说里面80%的因子仍然还行之有效并被运用在实盘项目中。在BigQuant策略研究平台上,可通过表达式快速进行因子构建和数据标注,再也不需要自己手动编写冗长代码。表达式简介因为在机器学习和深度学习中,因子是一个很重要的概念,也被称为特征,开发原创 2020-11-30 17:21:06 · 7778 阅读 · 0 评论 -
研究分享:用随机森林预测股价走势
原文:《Predicting the direction of stock market prices using random forest》原文下载机器学习已经广泛地应用在对于资产市场的分析中,在量化投资中尤为显著。但是,在浩如烟海的机器学习算法中,到底哪种算法能取得更优的预测效果呢?发表在《Applied Mathematical Finance》的这篇文章利用随机森林算法对股价d天之后...原创 2020-11-30 10:34:51 · 5946 阅读 · 0 评论