Deep Reinforcement Learning for Market Making 深度强化学习做市论文笔记和心得体会

最新推荐文章于 2023-09-19 23:47:19 发布

时间里的河

最新推荐文章于 2023-09-19 23:47:19 发布

阅读量465

点赞数

文章标签：论文阅读人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_37726222/article/details/126939595

版权

摘要

做市是一种高频交易策略，在这种策略中，经纪人提供流动性，同时对一种资产报出买入价和卖出价。做市商通过买入和卖出价格之间的价差来获取利润。由于库存风险、交易对手和信息不对称的复杂性，各学科的学者对做市算法的理解相对缺乏探索。在本文中，我们开发了极限或极限市场的真实模拟，并利用它设计了一个使用深度循环q -网络的做市代理。我们的方法优于文献中的一个杰出的基准策略，该策略使用时间差分temporal-difference强化学习来设计做市商代理。代理成功地从每次模拟中重现历史贸易数据中的程式化事实。

This paper uses a variant of Deep Recurrent Q-Networks (DRQN) to design market making agents interacting with realistic limit order book simulation framework.
本文利用深度递归q -网络(DRQN)的一个变种，设计了与现实的限价订单簿交互的做市代理仿真框架。

文章的贡献

本文的主要贡献是开发了限价单市场的真实模拟，并利用它设计了一个使用DRQN的做市代理。

该模拟框架考虑了代理的延迟，并按照NYSE的定义计算了累积的制造者/接受者费用。

我们修改了经典的DQRN架构，并纳入了双Q学习和优先级经验（double Q-learning and prioritized experience ），以考虑波动、流动性不足和停滞的市场。

我们的方法优于文献中的一个突出的基准策略，这个基准策略使用时间差异（TD）强化学习来设计做市商代理。

结论

在本文中，我们使用深度循环q网络设计了一个做市代理，其性能优于

最低0.47元/天解锁文章

时间里的河

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

时间里的河 CSDN认证博客专家 CSDN认证企业博客

码龄8年

142: 原创

5万+: 周排名

26万+: 总排名

23万+: 访问

: 等级

2604: 积分

65: 粉丝

89: 获赞

32: 评论

376: 收藏

私信

关注

热门文章

分类专栏

量化交易 15篇
强化学习 6篇
工具 10篇
高频交易研究 3篇
环境配置大问题 3篇
资源 2篇
kungfu 1篇
terminal 1篇
快捷键 1篇
CS 9篇
java 26篇
随笔 21篇
日记 3篇
读书 4篇
Java核心技术卷一 7篇
数据挖掘 2篇
软件工程 3篇
js 2篇
android

最新评论

Stochastic Approximation 随机近似方法的详解之（二）Robbins-Monro Algorithm
zhangpengfei233: 不太确定哈，第一个例子貌似错误了，g的梯度没有没有边界，导致不收敛，我刚刚算了一下。
MAPPO 算法的深度解析与应用和实现
时间里的河: 我觉得主要是值函数的输入似乎不是CTDE中的那个全局状态表示，而是所有智能体的obs的组合
MAPPO 算法的深度解析与应用和实现
蓝天白云大海沙滩Herman: 请问一下MAPPO是集中训练和分散执行(CTDE)算法吗，为什么原文related work第一段最后一句话说不是CTDE"our method, MAPPO, fails into the CTDE category by combining individual PPO training with a global valuw function".如果是CTDE，这个算法是怎么体现的呢，具体在流程上
快速升级到g++11和gcc11
小九华: https://www.littlezhang.com/2021/01/%E4%BD%BF%E7%94%A8%E5%8F%8D%E5%90%91%E4%BB%A3%E7%90%86%E5%8A%A0%E9%80%9F-ubuntu-ppa/#:~:text=%E8%BF%99%E4%B8%AA%20%E7%9F%A5%E4%B9%8E%E5%9B%9E%E7%AD%94%20%E5%BE%88%E5%A5%BD%E7%9A%84%E8%A7%A3%E5%86%B3%E4%BA%86%E9%97%AE%E9%A2%98%E3%80%82%20%E4%BD%BF%E7%94%A8%E4%B8%AD%E7%A7%91%E5%A4%A7%E6%8F%90%E4%BE%9B%E7%9A%84%E5%8F%8D%E5%90%91%E4%BB%A3%E7%90%86%E5%8F%AF%E4%BB%A5%E6%8F%90%E9%AB%98%20PPA%20%E7%9A%84%E4%B8%8B%E8%BD%BD%E9%80%9F%E5%BA%A6%E3%80%82%20%E5%9C%A8%20%2Fetc%2Fapt%2Fsources.list.d,PPA%20%E6%B7%BB%E5%8A%A0%E7%9A%84%20list%20%E6%96%87%E4%BB%B6%EF%BC%8C%E6%8A%8A%E5%85%B6%E4%B8%AD%E7%9A%84%20http%3A%2F%2Fppa.launchpad.net%20%E6%9B%BF%E6%8D%A2%E4%B8%BA%20https%3A%2F%2Flaunchpad.proxy.ustclug.org%20%E3%80%82 解决了
快速升级到g++11和gcc11
小九华: install速度极慢怎么办呢？

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。