深度学习
Mystery_zero
神秘人Zero
展开
-
强化学习-Vanilla Policy Gradient(VPG)
文章目录BackgroundQuick FactsKey EquationsExploration vs. ExploitationPseudocodeDocumentationReferancesBackground策略梯度背后的关键思想是提高导致更高回报的操作的概率,并降低导致低回报的操作的概率,直到获得最佳策略。Quick FactsVPG 是一个on-policy算法VPG 能...翻译 2020-01-26 11:42:41 · 3037 阅读 · 0 评论 -
Soft-Actor-Critic-强化学习算法
文章目录BackgroundQuick FactsKey EquationsEntropy-Regularized Reinforcement LearningSoft Actor-CriticExploration vs. ExploitationPseudocodeDocumentationBackgroundSAC算法,它以off-policy方式优化随机策略,从而在随机策略优化和DDP...翻译 2020-01-26 11:29:37 · 2724 阅读 · 0 评论 -
强化学习核心文章一百篇
文章目录1. Model-Free RLa. Deep Q-Learningb. Policy Gradientsc. Deterministic Policy Gradientsd. Distributional RLe. Policy Gradients with Action-Dependent Baselinesf. Path-Consistency Learningg. Other Di...转载 2020-01-21 13:57:26 · 1076 阅读 · 0 评论 -
Policy Optimization-强化学习业界手册
文章目录Deriving the Simplest Policy Gradient1.轨迹的概率 (Probability of a Trajectory)2.对数导数技巧3.轨迹的对数概率4.环境函数的梯度5.轨迹的梯度对数概率综上所述,我们得出以下结论:Implementing the Simplest Policy Gradient1.建立策略网络2.构建损失函数3.运行训练的一个Epoch...翻译 2020-01-21 13:39:23 · 636 阅读 · 0 评论 -
强化学习基础
文章目录强化学习基础概念MP策略π\piπRewardState Value functionState Value Bellman equationState-Action Value functionState-Action Value Bellman equationLook ahead最优值函数Greedyϵ\epsilonϵ-greedysoftmax强化学习算法有模型动态规划无模型基于...原创 2020-01-04 13:56:19 · 304 阅读 · 0 评论 -
PolicyGradientMethods-强化学习
文章目录Neural network as ActorGradient AscentMonte Carlo Policy GradientAdd a BaselineCriticActor-CriticTipsA3CPathwise Derivative Policy GradientNeural network as Actor用一个Actor(Policy)玩游戏,在一个episode中...原创 2019-12-26 15:35:39 · 286 阅读 · 1 评论 -
tensorflow对应的cudnn、cuda版本
具体看https://tensorflow.google.cn/install/source_windows转载 2018-11-12 20:13:14 · 805 阅读 · 0 评论 -
DeepLearning.AI笔记:二、神经网络编程基础
文章目录第一周神经网络编程基础2.1 二分类(Binary Classification)2.2逻辑回归(Logistic Regression)第一周神经网络编程基础2.1 二分类(Binary Classification)假设有一张图片作为输入,1(cat) vs 0(not cat)在计算机中保存一张图片需要RBG三种颜色的矩阵通道,如果图片像素为64∗6464*6464∗64,那...翻译 2018-12-23 15:10:54 · 20493 阅读 · 0 评论 -
DeepLearning.AI第一部分第三周、 浅层神经网络(Shallow neural networks)
文章目录3.2神经网络的表示Neural Network Representation3.2神经网络的表示Neural Network Representation下面是一张神经网络的图片,现在给此图的不同部分约定一些名字图3.2.13.2.13.2.1有一个个体,属性值为:x1,x2,x3x_1,x_2,x_3x1,x2,x3,输入层:即&amp翻译 2019-02-24 10:48:24 · 423 阅读 · 0 评论 -
ubuntu16.04配置量化投资tensorflow/pytorch深度学习环境
安装anaconda2-4.0.0bash xxx.sh2.安装tensorflow把之前备份的.cache文件夹复制过来就不用花太长时间下载了3.安装tushare在移动硬盘中存有tushare-1.2.18-py2-none-any.whl如果没有的话就去https://pypi.org/project/tushare/#files下载pip install tushare-1...原创 2019-01-02 19:56:11 · 397 阅读 · 0 评论 -
Deeplearnng.AI第四部分第一周、卷积神经网络
文章目录1.2边缘检测1.2边缘检测翻译 2019-01-14 11:34:40 · 334 阅读 · 0 评论 -
深度学习笔记之DenseNets
文章目录简介DenseNets密集连接(Dense connectivity)复合函数(Composite Function)池化层增长率(Growth rate)瓶颈层(Bottleneck layers)压缩(Compression)实施细节(Implementation Details)简介在Densely Connected Convolutional Networks这篇文章中作者提...翻译 2019-01-21 21:30:03 · 1858 阅读 · 0 评论 -
Deeplearnng.AI第四部分第二周、经典网络
文章目录2.1 为什么要看实际例子2.2 经典网络(Classic networks)LeNet-5AlexNetVGG-162.1 为什么要看实际例子2.2 经典网络(Classic networks)LeNet-5.AlexNetVGGNetLeNet-5首先看看 LeNet-5 的网络结构,假设你有一张 32×32×1 的图片,LeNet-5 可以识别图中的手写数字,比如像...翻译 2019-01-17 21:04:46 · 224 阅读 · 0 评论 -
DeepLearning.AI第一部分第四周:深层神经网络
文章目录翻译 2019-03-07 10:10:43 · 474 阅读 · 0 评论 -
ubuntu16.04安装cuda8./9.
1、检查自己的电脑环境是否具备安装CUDA的条件a) 检查自己的GPU是否是CUDA-capable在终端中输入:$ lspci | grep -i nvidia会显示自己的NVIDIA GPU版本信息去CUDA的官网查看自己的GPU版本是否在CUDA的支持列表中b) 检查自己的Linux版本是否支持 CUDA(Ubuntu 16.04没问题)c) 检查自己的系统中是否装了gcc在...原创 2018-11-11 12:16:30 · 1016 阅读 · 0 评论