深度强化学习
文章平均质量分 63
coder_by
用技术提升美好事物发生的概率。
展开
-
基于DQN的快速避障路径规划
全文内容:基于DQN的快速避障路径规划基础知识:Q-learningDeep Q-Network(DQN)代码详解:initialisingtarget.pytraining2.py原创 2021-05-14 10:36:54 · 4415 阅读 · 0 评论 -
batch size设置技巧
深度学习中经常看到epoch、 iteration和batchsize这三个的区别:(1)batchsize:批大小。在深度学习中,一般采用SGD训练,即每次训练在训练集中取batchsize个样本训练;(2)iteration:1个iteration等于使用batchsize个样本训练一次;(3)epoch:1个epoch等于使用训练集中的全部样本训练一次;举个例子,训练集有1000个样本,batchsize=10,那么训练完整个样本集需要:100次iteration,1次epoch。1.当数原创 2021-05-13 14:26:22 · 3577 阅读 · 0 评论 -
基于深度强化学习的路径规划笔记
感谢知乎周思雨博主;此方法同源借鉴于ICIA一篇强化学习paper源码github地址:https://github.com/a7b23/Autonomous-MazePathFinder-using-DQN该程序将由几个封锁(由块颜色表示)组成的图像作为输入,起始点由蓝色表示,目的地由绿色表示。 它输出一个由输入到输出的可能路径之一组成的图像。 下面显示的是程序的输入和输出。输入图像被馈送到由2个conv和2个fc层组成的模型,其输出对应于底部和右侧动作的Q值。 代理根据哪个Q值更大而向右或向.原创 2021-05-12 10:14:35 · 5384 阅读 · 1 评论 -
深度强化学习博客阅读
深度强化学习(Deep Reinforcement Learning)入门深度强化学习——Dueling-DDQN强化学习导论原创 2021-05-12 09:44:05 · 99 阅读 · 0 评论 -
深度学习基础知识
神经网络1. 感知机感知机(Perceptron)是 Frank Rosenblatt 在1957年提出的概念,其结构与MP模型类似,一般被视为最简单的人工神经网络,也作为二元线性分类器被广泛使用。通常情况下指单层的人工神经网络,以区别于多层感知机(Multilayer Perceptron)。尽管感知机结构简单,但能够学习并解决较复杂问题。假设我们有一个n维输入的单层感知机,x1至 xn为 n 维输入向量的各个分量, w1j至 wnj为各个输入分量连接到感知机的权量(或称权值),theta 为原创 2021-05-07 11:27:32 · 611 阅读 · 0 评论 -
3*3小卷积的优势
我们知道现在在构建CNN时大家喜欢用33的卷积,而不是早期的55,77等更大尺寸的卷积,如vgg系列网络中全部使用了33的卷积。这里既然用3*3卷积来替代更大尺寸的卷积,那么有一个前提,就是要保证两者具有同样大小的输出和感受野。两个33的卷积才能代替一个55的卷积;三个33的卷积才能代替一个77的卷积。以stride=1,padding=0我们来看看为何。我们首先看一下采用55卷积的方案。假设图像大小为nn,采用5*5的卷积核其输出为(n-5)/1+1=n-4。我们再看一下采用3*3卷积的方案原创 2021-05-07 10:58:00 · 2062 阅读 · 0 评论 -
图像处理中的卷积核kernel
kernel 中的卷积核介绍:简介卷积核(kernel),也叫卷积矩阵(convolution matrix)或者掩膜(mask),本质上是一个非常小的矩阵,最常用的是 3×3 矩阵。主要是利用核与图像之间进行卷积运算来实现图像处理,能做出模糊、锐化、凹凸、边缘检测等效果。卷积运算卷积在通俗上理解是把原始矩阵中的每一个元素,都与其相邻的元素根据卷积核的权重分布做加权平均,卷积运算的公式如下:其中,g(x,y)是被处理后的矩阵,w 是卷积核,f(x,y)是原始矩阵,-a≤s≤a 并且 -b≤t≤b原创 2021-05-07 10:41:26 · 12998 阅读 · 3 评论 -
卷积核(kernel)和过滤器(filter)的区别
之前就遇到过类似的问题,但是没有在中文社区中找到一种通俗易懂的答案,于是决定写下这篇文章,希望能给有类似困惑的人一个比较清晰的解释。卷积核就是由长和宽来指定的,是一个二维的概念。而过滤器是是由长、宽和深度指定的,是一个三维的概念。过滤器可以看做是卷积核的集合。过滤器比卷积核高一个维度——深度。下面结合一个多通道的例子马上就能理解了:图1是对一个3通道的图片做卷积操作,卷积核的大小为 3 × 3 ,卷积核的数目为3,此时过滤器指的就是这三个卷积核的集合,维度是 3 × 3原创 2021-05-07 10:16:30 · 1789 阅读 · 4 评论