Tensorflow
nbszg
这个作者很懒,什么都没留下…
展开
-
强化学习笔记+代码(七):Actor-Critic、A2C、A3C算法原理和Agent实现(tensorflow)
本文主要整理和参考了李宏毅的强化学习系列课程和莫烦python的强化学习教程本系列主要分几个部分进行介绍强化学习背景介绍SARSA算法原理和Agent实现Q-learning算法原理和Agent实现DQN算法原理和Agent实现(tensorflow)Double-DQN、Dueling DQN算法原理和Agent实现(tensorflow)Policy Gradients算法原理...原创 2020-03-27 11:41:58 · 7225 阅读 · 1 评论 -
强化学习笔记+代码(六):Policy Gradient结构原理和Agent实现(tensorflow)
本文主要整理和参考了李宏毅的强化学习系列课程和莫烦python的强化学习教程本系列主要分几个部分进行介绍强化学习背景介绍SARSA算法原理和Agent实现Q-learning算法原理和Agent实现DQN算法原理和Agent实现Double-DQN、Dueling DQN算法原理和Agent实现Policy Gradients算法原理和Agent实现A2C、A3C算法原理和Age...原创 2020-03-25 18:59:17 · 2452 阅读 · 6 评论 -
强化学习笔记+代码(五):Double-DQN、Dueling DQN结构原理和Agent实现
本文主要整理和参考了李宏毅的强化学习系列课程和莫烦python的强化学习教程本系列主要分几个部分进行介绍强化学习背景介绍SARSA算法原理和Agent实现Q-learning算法原理和Agent实现DQN算法原理和Agent实现Double-DQN、Dueling DQN结构原理和Agent实现Policy Gradients算法原理和Agent实现A2C、A3C算法原理和Age...原创 2020-03-24 17:03:57 · 7362 阅读 · 1 评论 -
强化学习笔记+代码(四):DQN算法原理和Agent实现
本文主要整理和参考了李宏毅的强化学习系列课程和莫烦python的强化学习教程本系列主要分几个部分进行介绍强化学习背景介绍SARSA算法原理和Agent实现Q-learning算法原理和Agent实现DQN算法原理和Agent实现Double-DQN、Dueling DQN结构原理和Agent实现Policy Gradients算法原理和Agent实现A2C、A3C算法原理和Age...原创 2020-03-23 19:36:51 · 9604 阅读 · 4 评论 -
强化学习笔记+代码(三):Q-learning算法原理和Agent实现
本文主要整理和参考了李宏毅的强化学习系列课程和莫烦python的强化学习教程本系列主要分几个部分进行介绍强化学习背景介绍SARSA算法原理和Agent实现Q-learning算法原理和Agent实现DQN算法原理和Agent实现Double-DQN、Dueling DQN算法原理和Agent实现Policy Gradients算法原理和Agent实现A2C、A3C算法原理和Age...原创 2020-03-23 15:54:37 · 4905 阅读 · 0 评论 -
tensorflow使用DNN、CNN、RNN(lstm)分别实现识别mnist手写数字图片
本文只用全连接神经网络+batchNormlization_dropout实现mnist手写数字图片识别。import osimport structimport numpy as npimport tensorflow as tf#数据加载函数def load_mnist(path, kind='train'): """load mnist date Args: ...原创 2020-03-20 22:11:12 · 1050 阅读 · 3 评论