q-trader-Deep Q-learning driven stock trader bot-代码学习

GitHub原地址 q-trader

概述

Q-learning 应用于(短期)股票交易的实现。该模型使用收盘价的 n 天窗口来确定在给定时间采取的最佳行动是买入、卖出还是坐稳。作为短期状态表示的结果,该模型不太擅长对长期趋势做出决策,但非常擅长预测波峰和波谷。

数据流

请添加图片描述
在这里插入图片描述

相关库学习

sys.argv python用法

解释器读取命令行参数,把脚本名与其他参数转化为字符串列表存到 sys 模块的 argv 变量里
第一个参数是脚本的名字, 后面的是依次输入的参数,适合一些简单参数输入的情形

import sys

if __name__ == "__main__":
    print(sys.argv)

$ python test.py a b c
['test.py', 'a', 'b', 'c']

注意它的参数是从程序外部输入的,如果想要在程序中得到这些参数可以使用 sys.argv[*] 得到

stock_name, window_size, episode_count = sys.argv[1], int(sys.argv[2]), int(sys.argv[3])
Python3 splitlines()方法

Python splitlines() 按照行(’\r’, ‘\r\n’, \n’)分隔,返回一个包含各行作为元素的列表,如果参数 keepends 为 False,不包含换行符,如果为 True,则保留换行符。

语法:str.splitlines([keepends])
参数:keepends – 在输出结果里是否去掉换行符(’\r’, ‘\r\n’, \n’),默认为 False,不包含换行符,如果为 True,则保留换行符。
返回值:返回一个包含各行作为元素的列表。

>>> 'ab c\n\nde fg\rkl\r\n'.splitlines()
['ab c', '', 'de fg', 'kl']
>>> 'ab c\n\nde fg\rkl\r\n'.splitlines(True)
['ab c\n', '\n', 'de fg\r', 'kl\r\n']
列表乘以负数变为空 [ ]

如果一个列表或一个元组乘以一个负值,它是如何变为空的?

>>> b = [1,2,3] * 2
>>> b
[1, 2, 3, 1, 2, 3]
>>> c = [1,2,3] * -1
>>> c
[]
>>> d = [1,2,3] * -2
>>> d
[]

添加链接描述

这种行为被记录在案:

在后一种情况下,执行序列重复;负重复因子产生空序列。

所以它这样做是因为这是记录在案的行为。它可能只是调用列表上的clear,或者做一些类似的事情。

判断语句优雅写法

常规写法

x = -6
if x < 0:
    y = -x
else:
    y = x
print(y)

# 结果
6

优雅写法

x = -6
y = -x if x<0 else x
print(y)

# 结果
6

在这里插入图片描述

python基础:deque用法

deque(maxlen=N) 创建了一个固定长度的队列,当有新的记录加入而队列已满时会自动移动除最老的那条记录

from collections import deque
d=deque(maxlen=3)
d.append(1)
d.append(2)
d.append(3)
print(d)
print(type(d))
d.append(4)
print(d)

输出如下:
deque([1, 2, 3], maxlen=3)
<class ‘collections.deque’>
deque([2, 3, 4], maxlen=3)

虽然通过列表操作(append、del)也能够完成deque的功能,但是队列的这种解决方案要更优雅的多,运行速度也将更快。如果deque不指定队列长度,将得到一个无界限的队列,可以在两端执行添加和弹出操作,例如:

from collections import deque
d=deque()
d.append(1)
d.append(2)
d.append(3)
print(d)
d.appendleft(4)
print(d)
d.pop()
print(d)
d.popleft()
print(d)

输出如下:
deque([1, 2, 3])
deque([4, 1, 2, 3])
deque([4, 1, 2])
deque([1, 2])

从队列两端添加或者弹出元素的复杂度都是O(1)。这和列表不同,当从列表的头部插入或者移除元素时,列表的复杂度为O(N)

deque更多用法

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值