自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

量化风云

量化编程、策略分享与教学

  • 博客(68)
  • 收藏
  • 关注

原创 机器学习(XgBoost)预测顶和底

之前的文章中,我们对中证1000指数进行了顶和底的标注。这一篇我们将利用这份标注数据,实现机器学习预测顶和底,并探讨一些机器学习的原理。我们选取的特征非常简单–上影线和WR(William’s R)的一个变种。他们的结论是,根据这两类指标的变种得到的综合因子,在2009到2020年4月,以全A为样本,进行5组分层多空测试,得到,可以说具有非常明显的信号意义。

2024-04-23 21:43:27 1208

原创 新国九条下,低波动因子重要性提升!

人迹罕至的道路,有时提供更好的旅程。**新国九条之后,红利股在投资中的重要性将大大加强**,而低波动因子在发现红利股、白马股方面有优秀的选择能力。如果一个市场里的财务数据不那么可靠,那么我们就应该使用低波动因子来代替价值因子。**量价数据永远不说谎**。如果一家过去看起来很好的公司,最近出了问题,看财报的人永远是最后一个知道的。但股价会提前反映。

2024-04-23 21:39:32 722

原创 为了机器学习量化策略,我标注了两万条数据

很多人对基于机器学习的量化策略很好奇,常常问什么时候有机器学习的课。其实,对很多人(我自己就是)来说,没有能力改进机器学习的算法和框架,机器学习都是作为黑盒子来学习,难度主要是卡在训练数据上。这篇文章,将介绍一种数据标注方法和工具。

2024-04-20 22:25:46 802

原创 Don‘t fly solo! 量化之路,AI伴飞

在投资界,巴菲特与查理.芒格的神仙友谊,是他们财富神话之外的另一段传奇。巴菲特曾这样评价芒格:他用思想的力量拓展了我的视野,让我以火箭的速度,从猩猩进化到人类。人生何幸能得到一知己。如果没有这样的机缘,在AI时代,至少我们做量化时,可以让AI来伴飞。

2024-04-20 22:22:47 828

原创 如何确定这就是底部?量化分析提供了概率证据

3月28日那篇文章分析了前一日的下跌为什么是可能预见的。这一篇文章,我将用坚实的统计数据,说明这一天为什么应该抄底,预期的损益比又是多少。

2024-04-11 08:51:16 666

原创 月亮和Pandas - Wes Mckinney的传奇故事

正如死亡和税收不可避免,Pandas对量化人而言,也具有同样的地位 -- 每个人都不可避免地要与之打交道。而Wes Mckinney正是Pandas的创建者。Pandas是有史以来,最成功的Python库之一,以一已之力,开拓了Python的生存空间。

2024-04-11 08:49:45 735

原创 没能上热搜,但卡尼曼值得我们纪念

3月27日,行为经济学的开山鼻祖丹尼尔.卡尼曼去世。作为行为经济学的一个分支,行为金融学在量化中的运用越来越广泛,并成功地解释了时序方向上价格波动的诸多原因。卡尼曼的重要贡献是建立起了一套形式化方法,使得运用心理学来解释和预测经济行为的研究纳入了科学的轨道。

2024-04-02 07:15:00 644

原创 大跌原因找到了!不是国足输球!

周日莫斯科的恐袭,让所有的A股交易者捏了一把汗,怕不是我A又要买单?果然,短短三日,沪指跌去1.8%,中证1000跌去5.89%,亏钱效应还是非常明显的。痛定之后,留下几个复盘问题,首先是,下跌的原因是什么?当然,我们求解的方法,都是量化思路。

2024-03-28 07:15:00 660

原创 7因子模型,除了规模、市场、动量和价值,还有哪些?

这篇文章的源起是有读者问,七因子模型除了规模、市场、动量和价值之外,还包括哪几个因子?就这个题目,正好介绍一下Fung & Hsieh的七因子模型。七因子模型一般是指David Hsieh和William Fung于2004年在一篇题为《Hedge Fund Benchmarks: A Risk Based Approach》中提出的7 factor model。

2024-03-27 07:15:00 713

原创 4k stars! 如何实现按拼音首字母查询证券代码?

一个可能只有少数量化人才需要的功能 -- 按拼音首字母来查找证券。比如,当我们键入ZGPA时,就能搜索出中国平安,或者是它的代码。这是我们使用行情软件时常用的一个功能。

2024-03-25 07:15:00 1459

原创 防范胜于救灾!版本管理是你的后悔药!

那是一个痛苦的夜晚。一些人开始准备善后方案,我们则带着愧疚的心情,努力试图让代码尽可能地回滚到通过测试的那个版本的状态。如果有 CI/CD,这种失误几乎不可能发生。如果有版本控制的话,即使发生了这种失误,纠错代价也会小很多。

2024-03-21 20:20:32 956

原创 提速100倍!QMT复权信息因子化的高效算法

QMT的XtQuant库提供了量化研究所需要的数据。它在一些API设计上面向底层多一些,应用层在使用时,还往往需要进行一些包装,比如复权就是如此。这篇文章介绍了将XtQuant的除权信息转换成常常的复权因子的高性能算法。与官方示例相比,速度快了100多倍。

2024-03-11 07:15:00 915

原创 后见之明!错过6个涨停板之后的复盘

在今年1月2日和1月3日,旅游板块两支个股先后涨停,此后一支月内三倍,另一支连续6个涨停。事后复盘,我们如何在1月2日第一支个股涨停之后,通过量化分析,找出第二支股?

2024-03-08 07:15:00 1709

原创 量化人这样用Jupyter(2) - JupySQL, D-tale

介绍了在Jupyter中直接执行SQL语句的扩展,以及基于GUI的可视化工具-dtale。更神奇的是,如果你不知道如何进行可视化绘图,这个工具连代码都掏给你了。

2024-03-06 14:24:50 992

原创 量化人这样用Jupyter!

Jupyter技巧一览高级篇。共分两期,这一期介绍魔法指令及如何在vscode中使用jupyter,以及使用ipython(interactive windows)。下一期讲jupyter中,量化人常用的可视化技巧。

2024-03-05 08:00:00 766

原创 Get Your Back Covered! Coverage, CodeCov和Tox

如果我们的软件支持 3 种操作系统,4 个 python 版本,我们就必须在 3 种操作系统上,分别创建 4 个虚拟环境,安装上我们的软件和依赖,再执行测试,上传测试报告。这个动作不仅相当繁琐,还很容易引入错误。

2024-03-04 08:00:00 893

原创 使用SQL来操作DataFrame?我们给pandas找了个新搭子

使用sql来操作DataFrame,这是一个令人感兴趣的话题

2024-01-29 08:00:00 1046

原创 从分数制到十进制,美股交易规则的改变如何影响到量化策略?

笔记左数效应、整数关口与光折射中引用了南加州大学Lawrence Harris的一篇论文中,哈理斯研究了交易价格的聚类效应。聚类效应对我们确定压力位、完善下单算法都有一定的影响。但是,2001年,美股变更交易制度,由分数制切

2024-01-26 08:00:00 950

原创 来自世坤!寻找Alpha 构建交易策略的量化方法

推荐这本《Finding Alphas: A Quantitative Approach to Building Trading Strategies》。我拿到的PDF是2019年的第二版。来自WorldQuant(世坤)的Igor Tulchinshky。

2024-01-25 08:00:00 579

原创 左数效应 整数关口与光的折射

常常有人问,新的因子/策略从哪里来?今天的笔记或许能启发你的思路。从1932年起,研究人员就注意到以9结尾的价格(比如$3.99),在消费者的认知中,要远远小于邻近的整数价格($4.00)。后来这一效应被称为 left-digit effect。在证券交易中,类似的情况一样存在,不过它的表现形式是整数关口压力。

2024-01-24 08:15:00 1258

原创 龙凤呈祥!如何用量化分析方法发现这种无厘头炒作?

2023年底,市场开始炒作龙字,后来又开始炒凤字,被戏称为龙凤呈祥。2024年的年度汉字可能是华。这是一种魔幻和无厘头的炒作。但就像一年有四季一样,A股一年至少会这样魔幻地炒一次。在历史上并不罕见。老股民会记得在2018年底,2019年初,出现了一支十倍牛股,东方通信。它带动了对”东方“这个词的炒作。一时间,只要标的名称中带有”东方“两字的,都能沾上一点雨露。

2024-01-23 11:20:16 1571

原创 测试覆盖与矩阵

tox 是一个通用的 Python 虚拟环境管理和测试命令行工具,旨在自动化和标准化 Python 测试。它是简化 Python 软件的打包、测试和发布过程的更大愿景的一部分。大多数项目都使用它来确保软件在多个 Python 解释器版本之间的兼容性。根据配置创建基于多个版本的 python 虚拟环境,并且保证这些虚拟环境的可复制性(需要与 poetry 或者其它依赖管理工具一起)。在多个环境中运行测试和代码检查工具,比如 pytest 和 flake8, black, mypy 等。隔离环境变量。

2024-01-20 23:48:49 1375

原创 Mock大法:Fake it till u make it!

Verweile doch, du bist so schön! 你是如此美丽,请逗留片刻吧!

2024-01-19 20:57:29 1090

原创 量化研究员!你应该如何写一手好代码

即使是Quant Researcher, 写一手高质量的代码也是非常重要的。再好的思路,如果不能正确地实现,都是没有意义的。写一手高质量的代码的意义,对Quant developer来讲就更是自不待言了。这篇笔记就介绍一些python best practice。

2024-01-18 10:08:50 1074 1

原创 Clickhouse: One table to rule them all!

前面几篇笔记我们讨论了存储海量行情数据的个人技术方案。它们之所以被称之为个人方案,并不是因为性能弱,而是指在这些方案中,数据都存储在本地,也只适合单机查询。数据源很贵 -- 在这个冬天,我们已经听说,某些上了规模的机构,也在让员工共享万得账号了。所以,共享网络存储,从而只需要一个数据账号,就成为合理的需求。更不必说,集中管理才可能让 IT 来进行数据维护,而分析师只需要专注于策略就好。

2024-01-17 10:20:20 1272

原创 单元测试:Testing leads to failure, and failure leads to understanding

Testing leads to failure, and failure leads to understanding

2024-01-16 20:29:22 1429 2

原创 2024年,如何打造惊艳的个人博客/出版系统并且赚点小钱?

几年前,我就推荐过用 Markdown 写作静态博客。静态博客几乎是零托管成本,比较适合个人博客起步。Markdown 便于本地搜索,也可当作是个人知识库方案。现在有了新的进展。我不仅构建了一个视觉上相当不错的个人网站,还美化了 github、构建了个人出版系统 -- 将文章导出为排版精美的图片和 pdf 的能力。

2024-01-15 20:01:08 1912

原创 2024年初私募量化策略大盘点

因子挖掘还是以手工为主,最有效的因子(策略)仍然是技术类的趋势+反转,无论是CTA还是量化多头都是如此。模型构成基本上都是机器学习。其中树模型比神经网络占比更大一些,有的机构中使用率高达90%。

2024-01-15 08:00:00 380

原创 量化交易简介,多图慎入!

量化交易课程导论

2024-01-14 23:46:52 412

原创 Alphalens因子分析(4) - Information Coefficient方法

在前面的笔记中,无论是回报分析,还是因子Alpha,它们都受到交易成本的影响。信息分析 (Information Analysis)则是一种不受这种影响的评估方法,主要研究方法就是信息系数(Information Coefficient)。

2024-01-12 08:00:00 1346

原创 因子分析(3)- 都是坑!这么简单的Alpha计算,竟然错了?!

我们继续 Alphalens 因子分析报告的解读。在过去的两篇笔记中,我们都提到,运用 Alphalens 进行因子分析步骤很简单,但是如果不了解它背后的机制与逻辑,很容易得到似是而非的结论。

2024-01-11 08:15:00 1271

原创 Alphalens因子分析(2) - 低换手率因子秒杀98%的基金经理?

上一篇笔记,我们已经为因子分析准备好了数据。这一篇笔记,我们就进行因子分析。分析过程在 Alphalens 中非常简单,核心是读懂它的报告。

2024-01-10 09:30:00 1076

原创 Alphalens 因子分析 - 以低换手率因子为例(1)

因子分析是量化研究的基本技能之一。通过因子分析,找出有效的因子,通过相关性去重后,就可以通过机器学习、线性回归等方法把因子组合起来,构成交易策略。这一篇笔记我们就介绍如何使用 Alphalens 来进行单因子分析。我们使用的因子是低换手率因子。

2024-01-09 08:00:00 1332

原创 我的剑,传给能挥舞它的人--量化书籍推荐!

这篇笔记介绍量化入门的参考书目。前1/4叹为观止,再1/4勉强点赞,再1/4乏善可陈,最后1/4简直不忍卒读。这是我对某本名书的评价,希望你并不会将这句话还给我。“不会的”,我安慰自己。不是文章多好,但你们厚道。

2024-01-08 01:39:29 666

原创 处女座程序员,请喜欢 Black

允许定制只会让团队陷入到无意义地争辩当中,而风格并无对错,习惯就好。我们常常看到在团队里,一些人为代码风格争论,其实他们反对的并不是某种风格本身,他们只是在反对自己的同事而已。

2024-01-07 08:00:00 1125

原创 Python能做大项目(9) - Mypy: 把静态类型检查带给Python

之前我们介绍过,Python作为一门动态语言,为人诟病的缺点之一,就是难以像java那样,支持静态类型检查,这样会把一些错误带到运行中(如果你不进行单元测试的话)。不过,随着type hint的推开,实际上现在Python已经有了比较充分的静态类型检查。这一章我们先介绍其它Lint工具,然后再重点介绍静态类型检查工具 - mypy。

2024-01-06 08:00:00 1987

原创 广义双曲分布、KS检验与抄底沪指

上一篇笔记我们抛出一个问题,沪指大跌 4%时,能不能抄底?今天的笔记,我们就通过 KS 检验,找出沪指的概率分布,进而回答这个问题。在后面的笔记中,我们还将换一个方法继续回答这个问题。

2024-01-05 08:00:00 1110

原创 Z-score 因子的深入思考

最新(2024 年 1 月)出版的 SC 技术分析(Techical Analysis of Stock & Commodities)的第 4 条文章给到了 Z-score,原文标题为《Z-score: How to use it in Trading》。今天的笔记,就借此机会,同步推出我们对通过Z-score来构建量化因子的一些观点。

2024-01-04 08:00:00 1211

原创 存了50TB!巨能“装”的量化数据存储方案

Apache Arrow是一种基于列向量的内存存储格式。Pyarrow是基于Arrow的一个封装库,实现IO,计算和提供表格视图。通过Pyarrow,可以提供TB级的量化交易数据存储。

2024-01-02 23:00:15 1147

原创 200倍速!基于 HDF5 的证券数据存储方案

1. hdf5是一种存储和处理大容量科学数据的文件格式及相应库 2. hdf5的读写速度是csv的数百倍。在240M记录中进行查找,速度约为0.2秒。 3. 读取hdf5文件的python库是h5py 4. 行情数据应该按周期创建群组。子数据集以证券代码为key。 5. 介绍了创建、查询和追加行情数据到hdf5文件中。 6. 增强hdf5性能的几种方式。

2024-01-02 07:30:00 1310

投资组合理论及实现,包括ipynb

现代投资组合理论(MPT)是由马科维茨于 1952 年提出的,是现代金融 7 个基本理论之一。它用数学术语描述了多元化和风险管理等概念,为投资者提供了构建多元化投资组合的工具集,即假定投资者投资于多个资产,在满足给定预期回报率下,可以通过优化求解出风险最小的投资组合。 所有的这些资产组合构成一条曲线(以资产组合的标准差为横轴,预期回报率为纵轴),称为前沿资产组合曲线,其中曲线的上半部分又被称为有效前沿。

2024-01-21

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除