- 博客(87)
- 收藏
- 关注
原创 QuanTide-weekly第1期
这周我们共发表5篇文章。等两篇详细讲解了机器学习构建组合策略的框架和常见问题。这两篇文章我们也集结后,发在本文末尾。在这一期的量化工具专栏中,我们发表了。IPython是非常轻量的交互式编程工具,尽管它的所有功能都可以在Notebook中找到,但它更轻,但仍然长袖擅舞,颇有飞燕之姿。在中,我们披露了《Python高效编程实践指南》出版过程中的一些冏事。这本书会对量化人构建稳健的交易系统非常有帮助。
2024-08-03 21:32:04 1259
原创 误入百花深处,沈醉不知归路!这些颜色网站的故事
用Powerpoint做课件,动画编排太累了,于是找到了slidev。Slidev好用是好用,但研墨调色都得自己来,一时竟误入藕花深处,沈醉不知归路。
2024-07-29 14:40:30 427
原创 圣杯依然闪耀 --基于短时RSI的均值回归策略跑出30%年化
圣杯依然闪耀 RSI 永远是我最爱的指标 – 因为潮汐和回归是这个蓝色星球的生命年轮,这样的轮回也存在于交易世界。而 RSI 就是刻画市场中的潮汐和回归的最好指标之一。
2024-07-23 14:48:05 1498
原创 pandas高级技巧之多级索引和分组操作
在量化领域,Pandas是不可或缺的工具,它以强大的数据处理和分析功能,极大地简化了数据操作流程。今天我们介绍两个技巧,都跟因子检验场景相关。第一个技巧是日期按月对齐;第二个是如何提取分组的前n条记录。讲解的概念涉及到group操作、索引的frequency概念以及多级索引的操作(读取和删除)。在最后一个例子中,更是反复使用了groupby,以简洁的语法,完成了一个略为复杂的数据操作。
2024-07-20 13:07:04 955
原创 全球Windows机器蓝屏,作为量化人,我的检讨来了
如果CrowedStrike实现了灰度部署,比如,一开始只部署1%的机器,并且监控升级后的情况(收集数据是灰度发布的一部分),然后在没有错误报告的情况下,再逐步扩大推送范围,就完全可以避免出现这么重大的事故。灰度发布同样适用于量化系统。2012年8月1日,骑士资本在纳斯达克交易所部署了一个新的交易软件,但是由于没有充分测试,该软件在激活时触发了一系列错误的交易指令,导致公司在45分钟内损失了约4.4亿美元。最终导致了它被Jefferies Group收购。
2024-07-19 22:57:11 1027
原创 月亮和Pandas -- 开源项目的挑战与机遇
如果你盯着月亮看,最终至少也能获得满天的清辉。Do as much good in the wold as I can
2024-07-19 10:22:34 652
原创 pip安装慢,如何换源?
如果觉得命令不好记,有两种方法,一是安装cfg4py,这是我开发的一个包,用来解决Python的配置文件读取问题,它可以让你用yaml格式写配置文件,但在程序中却是以python class的属性语法来访问配置项,这样不用写。更换 pip 的默认源至国内的镜像源可以显著提高下载速度,尤其是在网络环境不佳或国外源响应慢的情况下。在 Windows 系统中,配置文件通常位于用户的主目录下的 .pip 文件夹中,即 %USERPROFILE%.pip。不过我们这里要讲的是它的另一个功能,就是对常用配置进行提示。
2024-07-18 16:41:07 350
原创 问薪无愧!最全威的量化自学路线图
这是 Stat Arb 给独立自学量化的人开的一份清单。他的博客有 9000 多名付费用户,在量化圈比较有影响力。这个清单是 pdf 格式,74 页,内容非常全面。
2024-07-18 16:07:23 717
原创 为什么Python虚拟环境应该只用conda?
Python 的虚拟环境方案可谓源远流长,种类繁多。如果你接触 Python 已经有一段时间了,那么你很可能听说过 annaconda, virutalenv, venv, pip, pipenv, poetry, pyenv, pyvenv, pyenv-virtualenv, virtualenvwrapper, pyenv-virtualenv wrapper 等相似概念。
2024-07-18 07:30:00 1317
原创 关于IPython你需要知道的21个小技巧
IPython 是一个强大的交互式 Python shell,它比标准的 Python shell 提供了更多的功能和便利。IPython 由 Fernando Pérez 在 2001 年创建,旨在为科研人员和数据科学家提供一个更高效、更易用的交互式 Python 编程环境。随着时间的发展,IPython 已经成为科学计算、数据分析和机器学习领域中不可或缺的工具之一。IPython的成功,也催生了Jupyter。2014年,Jupyter 从 IPython 项目中分离出来,并扩展到其它语言。
2024-07-17 07:30:00 1155
原创 高端的食材,往往只需要最简单的烹饪!ORB,仅此一招,Alpha达到年化36%
常常看到有人提问,如何挖掘因子和策略?ORB 策略的改进历史能给我们许多启发。一是一个策略值得研究数十年;二是温故而知新是永远的法宝。沉下心来,真正吃透 IT 系统、吃透数据和已有策略,比追风要好得多。炒股要炒大热门,但对大热门的追踪,不一定是要通过文本分析。如果你对本文引用的资源感兴趣,请转发本文后领取这个策略来自 Carlo Zarattini 等人,在 Quantpedia 2023 年大赛中获第三名。
2024-07-16 09:53:31 1080
原创 不能求二阶导的metrics,不是好的objective?!
今天我们要分析 MAPE 这个函数在论文中的使用。以此为契机,适当深入一点机器学习的原理,讲以下两个知识点:1. 损失函数和度量函数2. XGBoost模型,因子数据是否要标准化。
2024-07-16 07:30:00 2366
原创 高薪金领都用啥编程语言?SQL、Python领航,附排名!
关于Python,在工程技巧方面可以参考我的新书《Python高效编程实战指南》,算法方面可以多刷leetcode、kaggle的题,或者简街、千禧的puzzle专栏,我们的专栏也不时会有一些性能优化的技巧。但是,金融行业对C++和Rust这样的互联网热门编程语言的需求并不大,尽管这两种语言在高频交易中不可或缺,但毕竟高频交易比较小众、无法吸纳大资金,因此行业的重心不会在这里。因此,Python才是真正意义上的王者,不仅仅是在金融领域,根据TIOBE 6月的排名,它仍然位居榜首,并且受欢迎程度在上升中。
2024-07-15 19:09:11 415
原创 基于 XGBoost 的组合策略基本框架
如何在投资组合策略中运用上机器学习方法? 最近,我们翻了下之前存过的论文,决定对《A portfolio Strategy Based on XGBoost Regression and Monte Carlo Method》这篇论文进行解读
2024-07-15 07:30:00 799
原创 反抗者的崛起!Fawce 和 Quantopian 的量化之路
在编写关于因子分析与机器策略的课程的过程中,无意中发现了 Fawce 的故事。受同样的理念激励的,不仅仅是 Quantopian, Fawce, Saeed,也包括分布在世界上其他地方的人,包括我自己。于是我决定暂停写作,花几天时间挖掘一下 Fawce 的故事,并和大家分享。**因为知道因何而战,永远比战斗本身更重要。**给所有量化人、和准备进入量化行业的人。
2024-07-14 23:17:30 779
原创 顶底背离的终极猜想和运用
对高频量化,他们看的是tick级数据,可能持有几分钟就会调仓;散户和量化多在日线和周线频率上操作,持有数天就调仓;长线资金以季度为单位。越是长线的资金,资金量越大,调仓时对走向的影响越强。现在,你应该已经猜到了,有一部分资金会在日线RSI高点时撤出;大量的资金会在周线的RSI高点撤出;而更大量的资金会在月线的RSI高点撤出。但我猜没有资金会根据季线的RSI高点撤出。许多真理,都不能线性外推。
2024-06-02 22:02:06 1331
原创 追寻美的指引--纪念西蒙斯
在西蒙斯逝去时,我想,他更希望被人作为数学家和慈善家被纪念,而不是企业家。这也是他父亲对他的期望。他做到了。财富扩大了西蒙斯的影响力,数学和慈善则延长了他的生命。
2024-06-02 22:00:44 783
原创 机器学习(XgBoost)预测顶和底
之前的文章中,我们对中证1000指数进行了顶和底的标注。这一篇我们将利用这份标注数据,实现机器学习预测顶和底,并探讨一些机器学习的原理。我们选取的特征非常简单–上影线和WR(William’s R)的一个变种。他们的结论是,根据这两类指标的变种得到的综合因子,在2009到2020年4月,以全A为样本,进行5组分层多空测试,得到,可以说具有非常明显的信号意义。
2024-04-23 21:43:27 1409
原创 新国九条下,低波动因子重要性提升!
人迹罕至的道路,有时提供更好的旅程。**新国九条之后,红利股在投资中的重要性将大大加强**,而低波动因子在发现红利股、白马股方面有优秀的选择能力。如果一个市场里的财务数据不那么可靠,那么我们就应该使用低波动因子来代替价值因子。**量价数据永远不说谎**。如果一家过去看起来很好的公司,最近出了问题,看财报的人永远是最后一个知道的。但股价会提前反映。
2024-04-23 21:39:32 801
原创 为了机器学习量化策略,我标注了两万条数据
很多人对基于机器学习的量化策略很好奇,常常问什么时候有机器学习的课。其实,对很多人(我自己就是)来说,没有能力改进机器学习的算法和框架,机器学习都是作为黑盒子来学习,难度主要是卡在训练数据上。这篇文章,将介绍一种数据标注方法和工具。
2024-04-20 22:25:46 932
原创 Don‘t fly solo! 量化之路,AI伴飞
在投资界,巴菲特与查理.芒格的神仙友谊,是他们财富神话之外的另一段传奇。巴菲特曾这样评价芒格:他用思想的力量拓展了我的视野,让我以火箭的速度,从猩猩进化到人类。人生何幸能得到一知己。如果没有这样的机缘,在AI时代,至少我们做量化时,可以让AI来伴飞。
2024-04-20 22:22:47 953
原创 如何确定这就是底部?量化分析提供了概率证据
3月28日那篇文章分析了前一日的下跌为什么是可能预见的。这一篇文章,我将用坚实的统计数据,说明这一天为什么应该抄底,预期的损益比又是多少。
2024-04-11 08:51:16 727
原创 没能上热搜,但卡尼曼值得我们纪念
3月27日,行为经济学的开山鼻祖丹尼尔.卡尼曼去世。作为行为经济学的一个分支,行为金融学在量化中的运用越来越广泛,并成功地解释了时序方向上价格波动的诸多原因。卡尼曼的重要贡献是建立起了一套形式化方法,使得运用心理学来解释和预测经济行为的研究纳入了科学的轨道。
2024-04-02 07:15:00 697
原创 大跌原因找到了!不是国足输球!
周日莫斯科的恐袭,让所有的A股交易者捏了一把汗,怕不是我A又要买单?果然,短短三日,沪指跌去1.8%,中证1000跌去5.89%,亏钱效应还是非常明显的。痛定之后,留下几个复盘问题,首先是,下跌的原因是什么?当然,我们求解的方法,都是量化思路。
2024-03-28 07:15:00 733
原创 7因子模型,除了规模、市场、动量和价值,还有哪些?
这篇文章的源起是有读者问,七因子模型除了规模、市场、动量和价值之外,还包括哪几个因子?就这个题目,正好介绍一下Fung & Hsieh的七因子模型。七因子模型一般是指David Hsieh和William Fung于2004年在一篇题为《Hedge Fund Benchmarks: A Risk Based Approach》中提出的7 factor model。
2024-03-27 07:15:00 981
原创 4k stars! 如何实现按拼音首字母查询证券代码?
一个可能只有少数量化人才需要的功能 -- 按拼音首字母来查找证券。比如,当我们键入ZGPA时,就能搜索出中国平安,或者是它的代码。这是我们使用行情软件时常用的一个功能。
2024-03-25 07:15:00 1569
原创 防范胜于救灾!版本管理是你的后悔药!
那是一个痛苦的夜晚。一些人开始准备善后方案,我们则带着愧疚的心情,努力试图让代码尽可能地回滚到通过测试的那个版本的状态。如果有 CI/CD,这种失误几乎不可能发生。如果有版本控制的话,即使发生了这种失误,纠错代价也会小很多。
2024-03-21 20:20:32 1006
原创 提速100倍!QMT复权信息因子化的高效算法
QMT的XtQuant库提供了量化研究所需要的数据。它在一些API设计上面向底层多一些,应用层在使用时,还往往需要进行一些包装,比如复权就是如此。这篇文章介绍了将XtQuant的除权信息转换成常常的复权因子的高性能算法。与官方示例相比,速度快了100多倍。
2024-03-11 07:15:00 1174
原创 后见之明!错过6个涨停板之后的复盘
在今年1月2日和1月3日,旅游板块两支个股先后涨停,此后一支月内三倍,另一支连续6个涨停。事后复盘,我们如何在1月2日第一支个股涨停之后,通过量化分析,找出第二支股?
2024-03-08 07:15:00 1885
原创 量化人这样用Jupyter(2) - JupySQL, D-tale
介绍了在Jupyter中直接执行SQL语句的扩展,以及基于GUI的可视化工具-dtale。更神奇的是,如果你不知道如何进行可视化绘图,这个工具连代码都掏给你了。
2024-03-06 14:24:50 1104
原创 量化人这样用Jupyter!
Jupyter技巧一览高级篇。共分两期,这一期介绍魔法指令及如何在vscode中使用jupyter,以及使用ipython(interactive windows)。下一期讲jupyter中,量化人常用的可视化技巧。
2024-03-05 08:00:00 838
原创 Get Your Back Covered! Coverage, CodeCov和Tox
如果我们的软件支持 3 种操作系统,4 个 python 版本,我们就必须在 3 种操作系统上,分别创建 4 个虚拟环境,安装上我们的软件和依赖,再执行测试,上传测试报告。这个动作不仅相当繁琐,还很容易引入错误。
2024-03-04 08:00:00 936
原创 从分数制到十进制,美股交易规则的改变如何影响到量化策略?
笔记左数效应、整数关口与光折射中引用了南加州大学Lawrence Harris的一篇论文中,哈理斯研究了交易价格的聚类效应。聚类效应对我们确定压力位、完善下单算法都有一定的影响。但是,2001年,美股变更交易制度,由分数制切
2024-01-26 08:00:00 1032
原创 来自世坤!寻找Alpha 构建交易策略的量化方法
推荐这本《Finding Alphas: A Quantitative Approach to Building Trading Strategies》。我拿到的PDF是2019年的第二版。来自WorldQuant(世坤)的Igor Tulchinshky。
2024-01-25 08:00:00 1120
原创 左数效应 整数关口与光的折射
常常有人问,新的因子/策略从哪里来?今天的笔记或许能启发你的思路。从1932年起,研究人员就注意到以9结尾的价格(比如$3.99),在消费者的认知中,要远远小于邻近的整数价格($4.00)。后来这一效应被称为 left-digit effect。在证券交易中,类似的情况一样存在,不过它的表现形式是整数关口压力。
2024-01-24 08:15:00 1317
原创 龙凤呈祥!如何用量化分析方法发现这种无厘头炒作?
2023年底,市场开始炒作龙字,后来又开始炒凤字,被戏称为龙凤呈祥。2024年的年度汉字可能是华。这是一种魔幻和无厘头的炒作。但就像一年有四季一样,A股一年至少会这样魔幻地炒一次。在历史上并不罕见。老股民会记得在2018年底,2019年初,出现了一支十倍牛股,东方通信。它带动了对”东方“这个词的炒作。一时间,只要标的名称中带有”东方“两字的,都能沾上一点雨露。
2024-01-23 11:20:16 1606
投资组合理论及实现,包括ipynb
2024-01-21
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人