自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(7)
  • 收藏
  • 关注

原创 【Python 强化学习DDPG算法预测股票走势】

利用强化学习DDPG预测股票近几天走势。

2023-04-16 11:07:11 956 5

原创 python对windows指定窗口截图

1.安装WinSpy。2.用WinSpy找到制定窗口的句柄。例如:用WinSpy识别QQ窗口的句柄。3.在python中用win32gui包获取所指句柄的窗口。具体代码如下:from PyQt5.QtWidgets import QApplication,QMainWindowfrom PyQt5.QtGui import *import win32guiimport sys import cv2 # 利用opencv读取图像import numpy as np# 利用matplo

2022-04-15 10:37:05 5961 2

原创 Python 深度强化学习算法(A3C)预测未来股票走势

本项目利用深度强化学习中的A3C算法提取某支股票的历史数据特征,然后预测未来15天的收盘价格走势。注:1)本项目使用tensorflow1.14版本。2)投资有风险,理财需谨慎。3)本人选择某股训练结果如下,通过实践表明,在市场环境相对稳定的情况下,本代码能够正确预测未来几天内的升降情况。但是单价数据会有些出入。1.数据导入需要从财经类网站自行下载自己意向的股票历史数据,将数据导入py文件中的python代码路径指向保存好的股票历史路径。通过训练1000次学习后预算未来15天的收盘价走势。"

2022-02-22 17:49:38 2717 15

原创 Actor-critic算法

##Actor-critic算法import randomimport matplotlib.pyplot as pltx=[]y=[]def random_pick(some_list, probabilities):random_num = random.uniform(0,1)cumulative_probability = 0.0for item, item_probability in zip(some_list, probabilities): #遍历cumulativ

2021-11-24 16:17:47 1092

原创 Generalized Infinitesimal Gradient Ascent(GIGA)

Generalized Infinitesimal Gradient Ascent(GIGA)

2021-10-26 16:12:05 204

原创 神经网络——激活函数

神经网络——激活函数1959年,生物科学家研究青蛙神经元的时候发现,青蛙的神经元有多个输入(树突),当各个输入信号达到一定的阈值时,信号才会得到相应(激活)。于是计算机科学家由这得到启发创建神经网络的激活函数。最开始的激活函数时阶梯函数:当信号达到一定的值时,值才为1,否则为0.但是阶梯函数的缺点是的导数为0,无法进行参数跟新时,就有sigmoid函数,tanh函数,relu函数等等**sigmoid函数:**优点:处处可导,但是当自变量很大时,倒数趋于0,这时候用梯度更新参数时基本不会有多大改

2021-06-10 22:29:06 245 3

原创 基于DP的MDP中的值迭代和策略迭代的区别

值迭代和策略迭代的区别        值迭代与策略迭代都是强化学习中的动态规划方法(DP), 它们的框架相同,都包含两个过程——策略估计和策略改进。       不同的是策略迭代是在策略评估之后,等到值函数收敛之后再进行策略改进,而值迭代是在策略评估的时候,只要值函数改变,就直接进行策略改进。我们用伪代码比较两者的区别。策略迭代:值迭代:...

2021-03-07 21:18:34 1392

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除