干饭人秦-CSDN博客

原创【Python 强化学习DDPG算法预测股票走势】

利用强化学习DDPG预测股票近几天走势。

2023-04-16 11:07:11 956 5

1.安装WinSpy。2.用WinSpy找到制定窗口的句柄。例如：用WinSpy识别QQ窗口的句柄。3.在python中用win32gui包获取所指句柄的窗口。具体代码如下：from PyQt5.QtWidgets import QApplication,QMainWindowfrom PyQt5.QtGui import *import win32guiimport sys import cv2 # 利用opencv读取图像import numpy as np# 利用matplo

2022-04-15 10:37:05 5961 2

原创 Python 深度强化学习算法（A3C）预测未来股票走势

本项目利用深度强化学习中的A3C算法提取某支股票的历史数据特征，然后预测未来15天的收盘价格走势。注：1）本项目使用tensorflow1.14版本。2）投资有风险，理财需谨慎。3）本人选择某股训练结果如下，通过实践表明，在市场环境相对稳定的情况下，本代码能够正确预测未来几天内的升降情况。但是单价数据会有些出入。1.数据导入需要从财经类网站自行下载自己意向的股票历史数据，将数据导入py文件中的python代码路径指向保存好的股票历史路径。通过训练1000次学习后预算未来15天的收盘价走势。"

2022-02-22 17:49:38 2717 15

原创 Actor-critic算法

##Actor-critic算法import randomimport matplotlib.pyplot as pltx=[]y=[]def random_pick(some_list, probabilities):random_num = random.uniform(0,1)cumulative_probability = 0.0for item, item_probability in zip(some_list, probabilities): #遍历cumulativ

2021-11-24 16:17:47 1092

原创 Generalized Infinitesimal Gradient Ascent(GIGA)

Generalized Infinitesimal Gradient Ascent(GIGA)

2021-10-26 16:12:05 204

原创神经网络——激活函数

神经网络——激活函数1959年，生物科学家研究青蛙神经元的时候发现，青蛙的神经元有多个输入（树突），当各个输入信号达到一定的阈值时，信号才会得到相应（激活）。于是计算机科学家由这得到启发创建神经网络的激活函数。最开始的激活函数时阶梯函数：当信号达到一定的值时，值才为1，否则为0.但是阶梯函数的缺点是的导数为0，无法进行参数跟新时，就有sigmoid函数，tanh函数，relu函数等等**sigmoid函数:**优点：处处可导，但是当自变量很大时，倒数趋于0，这时候用梯度更新参数时基本不会有多大改

2021-06-10 22:29:06 245 3

原创基于DP的MDP中的值迭代和策略迭代的区别

值迭代和策略迭代的区别值迭代与策略迭代都是强化学习中的动态规划方法（DP），它们的框架相同，都包含两个过程——策略估计和策略改进。不同的是策略迭代是在策略评估之后，等到值函数收敛之后再进行策略改进，而值迭代是在策略评估的时候，只要值函数改变，就直接进行策略改进。我们用伪代码比较两者的区别。策略迭代：值迭代：...

2021-03-07 21:18:34 1392

qq_40072213的博客