量化学习
文章平均质量分 89
上杉翔二
悠闲地不定期更新多模态、搜索推荐、基础技术、前沿追踪的翔二
展开
-
BloombergGPT(LLM大模型用于金融科技)
为了打造目前最大的金融领域数据集,彭博社收集和整理了40多年的金融语言文档,其涵盖了一系列的主题,如新闻、档案、英文财经文档等等。首先通用数据集共包含了3450亿个token,占总数据集token量的48.73%,如上图所示,占比比较大的数据集有:Pile-CC数据集, C4数据集等等等等,以保证模型对自然语言理解的通用能力。总共训练了139,200步(~ 53天),并通过训练数据(709B个token中的569B)完成0.8个epoch后结束了模型训练,原因是验证集上的损失已经不再继续下降,甚至反增。原创 2023-04-05 22:00:14 · 5664 阅读 · 0 评论 -
Random Walk(随机游走)
金融和经济模型和概率统计学难以分离,对于这样的随机二级市场数据的理解和操作也是计算机科学的一个领域,十分有魅力的计算金融学。普通数据挖掘方法大多都是确定性模型,对于输入的输出往往没有随机性,而一些能给出概率的随机性模型似乎更加的适用,如蒙特卡洛模拟,即模拟输入一堆的随机数进行评估。几何布朗运动(Brownian motion)布朗运动是将看起来连成一片的液体,在高倍显微镜下看其实是由许许多...原创 2019-02-24 17:24:10 · 52380 阅读 · 3 评论 -
传统量化金融时序模型(ARMA,ml-XGBoost,dl-LSTM)
时间序列是指一系列时刻 t1, t2, …, tn 按照时间次序排列,然后尝试预测其tn+1时刻的状态。AR是线性预测,即已知N个数据,可由模型推出第N点前面或后面的数据,其本质类似于插值。GARCH,广义ARCH模型,是专门针对金融数据所做的模型,它对误差的方差做了进一步的分析,特别适合波动性预测。MA(moving average model,移动平均模型),使用趋势移动平均法建立直线趋...原创 2019-07-01 16:52:59 · 5915 阅读 · 0 评论 -
强化学习用于金融时序问题(Q,DQN,AC)
前一篇博文所整理的模型中,主要有ARMA、RL、SVM、LSTM方法,本篇主要以强化学习方法来解决相关问题。强化学习是关于Agent与环境之间进行的互动,通过不断与环境状况的交互来进行“学习”,在诸多的场景都取得了成功如alphaGo等,同样的,在金融市场中也通过交互来捕捉股票市场特征,用于指导交易进程也一定有效。Q-Learning话不多说,应用Q-Learning(博主博客已整理,不再赘述...原创 2019-07-01 17:01:12 · 8570 阅读 · 16 评论