q-trader-Deep Q-learning driven stock trader bot-代码学习

最新推荐文章于 2024-06-08 09:43:18 发布

莩甲柚

最新推荐文章于 2024-06-08 09:43:18 发布

阅读量235

点赞数

分类专栏：研究学习文章标签：强化学习 python

本文链接：https://blog.csdn.net/qq_36303923/article/details/120605644

版权

研究学习专栏收录该内容

4 篇文章 0 订阅

订阅专栏

GitHub原地址 q-trader

概述

Q-learning 应用于（短期）股票交易的实现。该模型使用收盘价的 n 天窗口来确定在给定时间采取的最佳行动是买入、卖出还是坐稳。作为短期状态表示的结果，该模型不太擅长对长期趋势做出决策，但非常擅长预测波峰和波谷。

数据流

请添加图片描述
在这里插入图片描述

相关库学习

sys.argv python用法

解释器读取命令行参数，把脚本名与其他参数转化为字符串列表存到 sys 模块的 argv 变量里
第一个参数是脚本的名字，后面的是依次输入的参数，适合一些简单参数输入的情形

import sys

if __name__ == "__main__":
    print(sys.argv)

$ python test.py a b c
['test.py', 'a', 'b', 'c']

注意它的参数是从程序外部输入的，如果想要在程序中得到这些参数可以使用 sys.argv[*] 得到

stock_name, window_size, episode_count = sys.argv[1], int(sys.argv[2]), int(sys.argv[3])

Python3 splitlines()方法

Python splitlines() 按照行(’\r’, ‘\r\n’, \n’)分隔，返回一个包含各行作为元素的列表，如果参数 keepends 为 False，不包含换行符，如果为 True，则保留换行符。

语法：str.splitlines([keepends])
参数：keepends – 在输出结果里是否去掉换行符(’\r’, ‘\r\n’, \n’)，默认为 False，不包含换行符，如果为 True，则保留换行符。
返回值：返回一个包含各行作为元素的列表。

>>> 'ab c\n\nde fg\rkl\r\n'.splitlines()
['ab c', '', 'de fg', 'kl']
>>> 'ab c\n\nde fg\rkl\r\n'.splitlines(True)
['ab c\n', '\n', 'de fg\r', 'kl\r\n']

列表乘以负数变为空 [ ]

如果一个列表或一个元组乘以一个负值，它是如何变为空的？

>>> b = [1,2,3] * 2
>>> b
[1, 2, 3, 1, 2, 3]
>>> c = [1,2,3] * -1
>>> c
[]
>>> d = [1,2,3] * -2
>>> d
[]

添加链接描述

这种行为被记录在案：

在后一种情况下，执行序列重复；负重复因子产生空序列。

所以它这样做是因为这是记录在案的行为。它可能只是调用列表上的clear，或者做一些类似的事情。

判断语句优雅写法

常规写法

x = -6
if x < 0:
    y = -x
else:
    y = x
print(y)

# 结果
6

优雅写法

x = -6
y = -x if x<0 else x
print(y)

# 结果
6

在这里插入图片描述

python基础：deque用法

deque(maxlen=N) 创建了一个固定长度的队列，当有新的记录加入而队列已满时会自动移动除最老的那条记录。

from collections import deque
d=deque(maxlen=3)
d.append(1)
d.append(2)
d.append(3)
print(d)
print(type(d))
d.append(4)
print(d)

输出如下：
deque([1, 2, 3], maxlen=3)
<class ‘collections.deque’>
deque([2, 3, 4], maxlen=3)

虽然通过列表操作（append、del）也能够完成deque的功能，但是队列的这种解决方案要更优雅的多，运行速度也将更快。如果deque不指定队列长度，将得到一个无界限的队列，可以在两端执行添加和弹出操作，例如：

from collections import deque
d=deque()
d.append(1)
d.append(2)
d.append(3)
print(d)
d.appendleft(4)
print(d)
d.pop()
print(d)
d.popleft()
print(d)

输出如下：
deque([1, 2, 3])
deque([4, 1, 2, 3])
deque([4, 1, 2])
deque([1, 2])

从队列两端添加或者弹出元素的复杂度都是O(1)。这和列表不同，当从列表的头部插入或者移除元素时，列表的复杂度为O(N)

deque更多用法

莩甲柚

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
q-trader-Deep Q-learning driven stock trader bot-代码学习

GitHub原地址 q-trader概述Q-learning 应用于（短期）股票交易的实现。该模型使用收盘价的 n 天窗口来确定在给定时间采取的最佳行动是买入、卖出还是坐稳。作为短期状态表示的结果，该模型不太擅长对长期趋势做出决策，但非常擅长预测波峰和波谷。数据流相关库学习sys.argv python用法解释器读取命令行参数，把脚本名与其他参数转化为字符串列表存到 sys 模块的 argv 变量里第一个参数是脚本的名字，后面的是依次输入的参数，适合一些简单参数输入的情形import s
复制链接

扫一扫

专栏目录