- 博客(6)
- 收藏
- 关注
原创 《白话强化学习与PyTorch》学习笔记---第九章
第九章---PG算法族9.1 DP9.2 Actor-Critic在第八章中的DQN算法族中,都是求一个状态或则一个状态下某个动作的估值为手段的“间接”求解策略,而本章中的策略梯度法(Policy Gradient)手段更为直接,直接让一个模型或则网络学到一个策略,从而可以解决DQN算法族中无法解决的连续控制问题。同样关于原理只是简单讲解,具体可以参考刘建平老师的系列博客。9.1 DP既然需...
2020-01-11 17:32:47
1126
6
原创 使用python中的tkinter模块制作一个学习打卡小软件
学习任务打卡小软件---戈多Sensei1.制定任务2.完成任务3.学习评估最近为了给我的星星⭐写一个学习记录软件,学习了一下python中的tkinter模块,做了一个可视化打卡界面,此处为源码:https://github.com/catziyan/Tkinter—Gordo_Sensei,想要学习tkinter的朋友可以直接下载此处为打包后的exe小程序,没有安装python的小伙伴也可...
2020-01-06 21:58:17
2308
7
原创 使用pyinstaller打包遇到的错误---Failed to execute script pyi_rth_certifi
在用pyinstaller打包python文件时,遇到如下错误:Failed to execute script pyi_rth_certifi 不能执行 pyi_rth_certifi脚本,作为小白的我在site-packages文件夹里找到这个脚本后也看不懂什么问题,最后在绝望中从anaconda的虚拟环境中用pyinstaller打包后成功了。最开始因为我有三个.py程序,以及会使用到...
2019-12-12 16:58:47
7301
2
原创 MATLAB GUI界面小总结
MATLAB GUI界面小总结新建和运行添加背景图片点击按钮后运行其他程序在坐标区中绘图自动在表格中写入数字弹出式菜单使用方法可编辑文本的数据传递msgbox修改GUI名字时的一些问题这几天做了一点关于matlab GUI界面的一些小小工作,这里主要记录一下小白的学习过程新建和运行在命令行窗口输入guide来建立一个空白GUI界面,从而会生成一个.fig文件和.m文件运行已建立的GUI界...
2019-12-02 17:20:09
2277
原创 《白话强化学习与PyTorch》学习笔记---第八章
《白话强化学习与PyTorch》学习笔记-第八章第八章用了DQN及各种改进算法来训练Gym中的atari游戏—pong首先先来看一下官方网站中的游戏介绍:简单来说,训练目的是使得分最大化。在这个环境中的观察结果(observation)是RGB图像,大小为(210,160,3),在2~4(随机采样)帧内重复同一个动作。从环境中得到observation后,我们会先对数据进行预处理操作:d...
2019-11-11 12:06:21
3959
19
原创 《白话强化学习与PyTorch》学习笔记---第六章
《白话强化学习与PyTorch》学习笔记---第六章第六章-深度学习1. 代码修改的主要内容2. 三种神经网络的个人总结2.1 全连接神经网络2.2 卷积神经网络:2.3 循环神经网络第六章-深度学习第六章主要用了三种神经网络实现了对手写数字(0~9)数据集MNIST的分类问题(全连接神经网络(feedforward_neural_net.py)、卷积神经网络(convoluntional_n...
2019-09-25 11:14:29
3093
2
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人