自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

量化风云

量化编程、策略分享与教学

  • 博客(83)
  • 收藏
  • 关注

原创 圣杯依然闪耀 --基于短时RSI的均值回归策略跑出30%年化

圣杯依然闪耀 RSI 永远是我最爱的指标 – 因为潮汐和回归是这个蓝色星球的生命年轮,这样的轮回也存在于交易世界。而 RSI 就是刻画市场中的潮汐和回归的最好指标之一。

2024-07-23 14:48:05 1335

原创 pandas高级技巧之多级索引和分组操作

在量化领域,Pandas是不可或缺的工具,它以强大的数据处理和分析功能,极大地简化了数据操作流程。今天我们介绍两个技巧,都跟因子检验场景相关。第一个技巧是日期按月对齐;第二个是如何提取分组的前n条记录。讲解的概念涉及到group操作、索引的frequency概念以及多级索引的操作(读取和删除)。在最后一个例子中,更是反复使用了groupby,以简洁的语法,完成了一个略为复杂的数据操作。

2024-07-20 13:07:04 744

原创 全球Windows机器蓝屏,作为量化人,我的检讨来了

如果CrowedStrike实现了灰度部署,比如,一开始只部署1%的机器,并且监控升级后的情况(收集数据是灰度发布的一部分),然后在没有错误报告的情况下,再逐步扩大推送范围,就完全可以避免出现这么重大的事故。灰度发布同样适用于量化系统。2012年8月1日,骑士资本在纳斯达克交易所部署了一个新的交易软件,但是由于没有充分测试,该软件在激活时触发了一系列错误的交易指令,导致公司在45分钟内损失了约4.4亿美元。最终导致了它被Jefferies Group收购。

2024-07-19 22:57:11 780

原创 月亮和Pandas -- 开源项目的挑战与机遇

如果你盯着月亮看,最终至少也能获得满天的清辉。Do as much good in the wold as I can

2024-07-19 10:22:34 611

原创 pip安装慢,如何换源?

如果觉得命令不好记,有两种方法,一是安装cfg4py,这是我开发的一个包,用来解决Python的配置文件读取问题,它可以让你用yaml格式写配置文件,但在程序中却是以python class的属性语法来访问配置项,这样不用写。更换 pip 的默认源至国内的镜像源可以显著提高下载速度,尤其是在网络环境不佳或国外源响应慢的情况下。在 Windows 系统中,配置文件通常位于用户的主目录下的 .pip 文件夹中,即 %USERPROFILE%.pip。不过我们这里要讲的是它的另一个功能,就是对常用配置进行提示。

2024-07-18 16:41:07 245

原创 问薪无愧!最全威的量化自学路线图

这是 Stat Arb 给独立自学量化的人开的一份清单。他的博客有 9000 多名付费用户,在量化圈比较有影响力。这个清单是 pdf 格式,74 页,内容非常全面。

2024-07-18 16:07:23 624

原创 为什么Python虚拟环境应该只用conda?

Python 的虚拟环境方案可谓源远流长,种类繁多。如果你接触 Python 已经有一段时间了,那么你很可能听说过 annaconda, virutalenv, venv, pip, pipenv, poetry, pyenv, pyvenv, pyenv-virtualenv, virtualenvwrapper, pyenv-virtualenv wrapper 等相似概念。

2024-07-18 07:30:00 1022

原创 不要去写书 除非是要与你的灵魂交谈

Let your light shine. 让你的光芒闪耀。

2024-07-17 22:14:04 1076

原创 关于IPython你需要知道的21个小技巧

IPython 是一个强大的交互式 Python shell,它比标准的 Python shell 提供了更多的功能和便利。IPython 由 Fernando Pérez 在 2001 年创建,旨在为科研人员和数据科学家提供一个更高效、更易用的交互式 Python 编程环境。随着时间的发展,IPython 已经成为科学计算、数据分析和机器学习领域中不可或缺的工具之一。IPython的成功,也催生了Jupyter。2014年,Jupyter 从 IPython 项目中分离出来,并扩展到其它语言。

2024-07-17 07:30:00 1124

原创 高端的食材,往往只需要最简单的烹饪!ORB,仅此一招,Alpha达到年化36%

常常看到有人提问,如何挖掘因子和策略?ORB 策略的改进历史能给我们许多启发。一是一个策略值得研究数十年;二是温故而知新是永远的法宝。沉下心来,真正吃透 IT 系统、吃透数据和已有策略,比追风要好得多。炒股要炒大热门,但对大热门的追踪,不一定是要通过文本分析。如果你对本文引用的资源感兴趣,请转发本文后领取这个策略来自 Carlo Zarattini 等人,在 Quantpedia 2023 年大赛中获第三名。

2024-07-16 09:53:31 980

原创 不能求二阶导的metrics,不是好的objective?!

今天我们要分析 MAPE 这个函数在论文中的使用。以此为契机,适当深入一点机器学习的原理,讲以下两个知识点:1. 损失函数和度量函数2. XGBoost模型,因子数据是否要标准化。

2024-07-16 07:30:00 2246

原创 高薪金领都用啥编程语言?SQL、Python领航,附排名!

关于Python,在工程技巧方面可以参考我的新书《Python高效编程实战指南》,算法方面可以多刷leetcode、kaggle的题,或者简街、千禧的puzzle专栏,我们的专栏也不时会有一些性能优化的技巧。但是,金融行业对C++和Rust这样的互联网热门编程语言的需求并不大,尽管这两种语言在高频交易中不可或缺,但毕竟高频交易比较小众、无法吸纳大资金,因此行业的重心不会在这里。因此,Python才是真正意义上的王者,不仅仅是在金融领域,根据TIOBE 6月的排名,它仍然位居榜首,并且受欢迎程度在上升中。

2024-07-15 19:09:11 344

原创 基于 XGBoost 的组合策略基本框架

如何在投资组合策略中运用上机器学习方法? 最近,我们翻了下之前存过的论文,决定对《A portfolio Strategy Based on XGBoost Regression and Monte Carlo Method》这篇论文进行解读

2024-07-15 07:30:00 639

原创 反抗者的崛起!Fawce 和 Quantopian 的量化之路

在编写关于因子分析与机器策略的课程的过程中,无意中发现了 Fawce 的故事。受同样的理念激励的,不仅仅是 Quantopian, Fawce, Saeed,也包括分布在世界上其他地方的人,包括我自己。于是我决定暂停写作,花几天时间挖掘一下 Fawce 的故事,并和大家分享。**因为知道因何而战,永远比战斗本身更重要。**给所有量化人、和准备进入量化行业的人。

2024-07-14 23:17:30 702

原创 顶底背离的终极猜想和运用

对高频量化,他们看的是tick级数据,可能持有几分钟就会调仓;散户和量化多在日线和周线频率上操作,持有数天就调仓;长线资金以季度为单位。越是长线的资金,资金量越大,调仓时对走向的影响越强。现在,你应该已经猜到了,有一部分资金会在日线RSI高点时撤出;大量的资金会在周线的RSI高点撤出;而更大量的资金会在月线的RSI高点撤出。但我猜没有资金会根据季线的RSI高点撤出。许多真理,都不能线性外推。

2024-06-02 22:02:06 1253

原创 追寻美的指引--纪念西蒙斯

在西蒙斯逝去时,我想,他更希望被人作为数学家和慈善家被纪念,而不是企业家。这也是他父亲对他的期望。他做到了。财富扩大了西蒙斯的影响力,数学和慈善则延长了他的生命。

2024-06-02 22:00:44 749

原创 机器学习(XgBoost)预测顶和底

之前的文章中,我们对中证1000指数进行了顶和底的标注。这一篇我们将利用这份标注数据,实现机器学习预测顶和底,并探讨一些机器学习的原理。我们选取的特征非常简单–上影线和WR(William’s R)的一个变种。他们的结论是,根据这两类指标的变种得到的综合因子,在2009到2020年4月,以全A为样本,进行5组分层多空测试,得到,可以说具有非常明显的信号意义。

2024-04-23 21:43:27 1300

原创 新国九条下,低波动因子重要性提升!

人迹罕至的道路,有时提供更好的旅程。**新国九条之后,红利股在投资中的重要性将大大加强**,而低波动因子在发现红利股、白马股方面有优秀的选择能力。如果一个市场里的财务数据不那么可靠,那么我们就应该使用低波动因子来代替价值因子。**量价数据永远不说谎**。如果一家过去看起来很好的公司,最近出了问题,看财报的人永远是最后一个知道的。但股价会提前反映。

2024-04-23 21:39:32 765

原创 为了机器学习量化策略,我标注了两万条数据

很多人对基于机器学习的量化策略很好奇,常常问什么时候有机器学习的课。其实,对很多人(我自己就是)来说,没有能力改进机器学习的算法和框架,机器学习都是作为黑盒子来学习,难度主要是卡在训练数据上。这篇文章,将介绍一种数据标注方法和工具。

2024-04-20 22:25:46 849

原创 Don‘t fly solo! 量化之路,AI伴飞

在投资界,巴菲特与查理.芒格的神仙友谊,是他们财富神话之外的另一段传奇。巴菲特曾这样评价芒格:他用思想的力量拓展了我的视野,让我以火箭的速度,从猩猩进化到人类。人生何幸能得到一知己。如果没有这样的机缘,在AI时代,至少我们做量化时,可以让AI来伴飞。

2024-04-20 22:22:47 877

原创 如何确定这就是底部?量化分析提供了概率证据

3月28日那篇文章分析了前一日的下跌为什么是可能预见的。这一篇文章,我将用坚实的统计数据,说明这一天为什么应该抄底,预期的损益比又是多少。

2024-04-11 08:51:16 686

原创 没能上热搜,但卡尼曼值得我们纪念

3月27日,行为经济学的开山鼻祖丹尼尔.卡尼曼去世。作为行为经济学的一个分支,行为金融学在量化中的运用越来越广泛,并成功地解释了时序方向上价格波动的诸多原因。卡尼曼的重要贡献是建立起了一套形式化方法,使得运用心理学来解释和预测经济行为的研究纳入了科学的轨道。

2024-04-02 07:15:00 656

原创 大跌原因找到了!不是国足输球!

周日莫斯科的恐袭,让所有的A股交易者捏了一把汗,怕不是我A又要买单?果然,短短三日,沪指跌去1.8%,中证1000跌去5.89%,亏钱效应还是非常明显的。痛定之后,留下几个复盘问题,首先是,下跌的原因是什么?当然,我们求解的方法,都是量化思路。

2024-03-28 07:15:00 685

原创 7因子模型,除了规模、市场、动量和价值,还有哪些?

这篇文章的源起是有读者问,七因子模型除了规模、市场、动量和价值之外,还包括哪几个因子?就这个题目,正好介绍一下Fung & Hsieh的七因子模型。七因子模型一般是指David Hsieh和William Fung于2004年在一篇题为《Hedge Fund Benchmarks: A Risk Based Approach》中提出的7 factor model。

2024-03-27 07:15:00 786

原创 4k stars! 如何实现按拼音首字母查询证券代码?

一个可能只有少数量化人才需要的功能 -- 按拼音首字母来查找证券。比如,当我们键入ZGPA时,就能搜索出中国平安,或者是它的代码。这是我们使用行情软件时常用的一个功能。

2024-03-25 07:15:00 1482

原创 防范胜于救灾!版本管理是你的后悔药!

那是一个痛苦的夜晚。一些人开始准备善后方案,我们则带着愧疚的心情,努力试图让代码尽可能地回滚到通过测试的那个版本的状态。如果有 CI/CD,这种失误几乎不可能发生。如果有版本控制的话,即使发生了这种失误,纠错代价也会小很多。

2024-03-21 20:20:32 978

原创 提速100倍!QMT复权信息因子化的高效算法

QMT的XtQuant库提供了量化研究所需要的数据。它在一些API设计上面向底层多一些,应用层在使用时,还往往需要进行一些包装,比如复权就是如此。这篇文章介绍了将XtQuant的除权信息转换成常常的复权因子的高性能算法。与官方示例相比,速度快了100多倍。

2024-03-11 07:15:00 1032

原创 后见之明!错过6个涨停板之后的复盘

在今年1月2日和1月3日,旅游板块两支个股先后涨停,此后一支月内三倍,另一支连续6个涨停。事后复盘,我们如何在1月2日第一支个股涨停之后,通过量化分析,找出第二支股?

2024-03-08 07:15:00 1780

原创 量化人这样用Jupyter(2) - JupySQL, D-tale

介绍了在Jupyter中直接执行SQL语句的扩展,以及基于GUI的可视化工具-dtale。更神奇的是,如果你不知道如何进行可视化绘图,这个工具连代码都掏给你了。

2024-03-06 14:24:50 1034

原创 量化人这样用Jupyter!

Jupyter技巧一览高级篇。共分两期,这一期介绍魔法指令及如何在vscode中使用jupyter,以及使用ipython(interactive windows)。下一期讲jupyter中,量化人常用的可视化技巧。

2024-03-05 08:00:00 782

原创 Get Your Back Covered! Coverage, CodeCov和Tox

如果我们的软件支持 3 种操作系统,4 个 python 版本,我们就必须在 3 种操作系统上,分别创建 4 个虚拟环境,安装上我们的软件和依赖,再执行测试,上传测试报告。这个动作不仅相当繁琐,还很容易引入错误。

2024-03-04 08:00:00 904

原创 使用SQL来操作DataFrame?我们给pandas找了个新搭子

使用sql来操作DataFrame,这是一个令人感兴趣的话题

2024-01-29 08:00:00 1234

原创 从分数制到十进制,美股交易规则的改变如何影响到量化策略?

笔记左数效应、整数关口与光折射中引用了南加州大学Lawrence Harris的一篇论文中,哈理斯研究了交易价格的聚类效应。聚类效应对我们确定压力位、完善下单算法都有一定的影响。但是,2001年,美股变更交易制度,由分数制切

2024-01-26 08:00:00 972

原创 来自世坤!寻找Alpha 构建交易策略的量化方法

推荐这本《Finding Alphas: A Quantitative Approach to Building Trading Strategies》。我拿到的PDF是2019年的第二版。来自WorldQuant(世坤)的Igor Tulchinshky。

2024-01-25 08:00:00 774

原创 左数效应 整数关口与光的折射

常常有人问,新的因子/策略从哪里来?今天的笔记或许能启发你的思路。从1932年起,研究人员就注意到以9结尾的价格(比如$3.99),在消费者的认知中,要远远小于邻近的整数价格($4.00)。后来这一效应被称为 left-digit effect。在证券交易中,类似的情况一样存在,不过它的表现形式是整数关口压力。

2024-01-24 08:15:00 1267

原创 龙凤呈祥!如何用量化分析方法发现这种无厘头炒作?

2023年底,市场开始炒作龙字,后来又开始炒凤字,被戏称为龙凤呈祥。2024年的年度汉字可能是华。这是一种魔幻和无厘头的炒作。但就像一年有四季一样,A股一年至少会这样魔幻地炒一次。在历史上并不罕见。老股民会记得在2018年底,2019年初,出现了一支十倍牛股,东方通信。它带动了对”东方“这个词的炒作。一时间,只要标的名称中带有”东方“两字的,都能沾上一点雨露。

2024-01-23 11:20:16 1578

原创 测试覆盖与矩阵

tox 是一个通用的 Python 虚拟环境管理和测试命令行工具,旨在自动化和标准化 Python 测试。它是简化 Python 软件的打包、测试和发布过程的更大愿景的一部分。大多数项目都使用它来确保软件在多个 Python 解释器版本之间的兼容性。根据配置创建基于多个版本的 python 虚拟环境,并且保证这些虚拟环境的可复制性(需要与 poetry 或者其它依赖管理工具一起)。在多个环境中运行测试和代码检查工具,比如 pytest 和 flake8, black, mypy 等。隔离环境变量。

2024-01-20 23:48:49 1436

原创 Mock大法:Fake it till u make it!

Verweile doch, du bist so schön! 你是如此美丽,请逗留片刻吧!

2024-01-19 20:57:29 1132

原创 量化研究员!你应该如何写一手好代码

即使是Quant Researcher, 写一手高质量的代码也是非常重要的。再好的思路,如果不能正确地实现,都是没有意义的。写一手高质量的代码的意义,对Quant developer来讲就更是自不待言了。这篇笔记就介绍一些python best practice。

2024-01-18 10:08:50 1109 1

原创 Clickhouse: One table to rule them all!

前面几篇笔记我们讨论了存储海量行情数据的个人技术方案。它们之所以被称之为个人方案,并不是因为性能弱,而是指在这些方案中,数据都存储在本地,也只适合单机查询。数据源很贵 -- 在这个冬天,我们已经听说,某些上了规模的机构,也在让员工共享万得账号了。所以,共享网络存储,从而只需要一个数据账号,就成为合理的需求。更不必说,集中管理才可能让 IT 来进行数据维护,而分析师只需要专注于策略就好。

2024-01-17 10:20:20 1284

投资组合理论及实现,包括ipynb

现代投资组合理论(MPT)是由马科维茨于 1952 年提出的,是现代金融 7 个基本理论之一。它用数学术语描述了多元化和风险管理等概念,为投资者提供了构建多元化投资组合的工具集,即假定投资者投资于多个资产,在满足给定预期回报率下,可以通过优化求解出风险最小的投资组合。 所有的这些资产组合构成一条曲线(以资产组合的标准差为横轴,预期回报率为纵轴),称为前沿资产组合曲线,其中曲线的上半部分又被称为有效前沿。

2024-01-21

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除