【无标题】

Miss Moonpence

已于 2023-10-09 14:39:58 修改

阅读量51

点赞数

文章标签：学习

于 2023-10-07 21:21:44 首次发布

本文链接：https://blog.csdn.net/m0_46241234/article/details/133653413

版权

【1】原文
DRL是将深度学习（DL）与强化学习（RL）结合，直接从高维原始数据学习控制策略。
DQN是DRL的其中一种算法，它要做的就是将卷积神经网络（CNN）和Q-Learning结合起来，CNN的输入是原始图像数据（作为状态State），输出则是每个动作Action对应的价值评估Value Function（Q值）。

【2】原文
在二维卷积层中，一个二维输入数组和一个二维核(kernel)数组通过互相关运算输出一个二维数组。
在这里插入图片描述
二维卷积层将输入和卷积核做互相关运算，并加上一个标量偏差来得到输出。
卷积层的模型参数包含了卷积核和标量偏差。我们在训练模型的时候，通常先对卷积层进行随机的初始化，然后不断迭代卷积核和偏差。

卷积窗口形状为 p × q 的卷积层称为 p × q 卷积层。

二维卷积层输出的二维数组可以看做是输入在空间维度上(宽和高)上某一级的表征，也叫特征图(feature map)。

【3】原文
CNN优缺点

【4】
CV，计算机视觉 Computer Vision

RGB，RGB色彩模式(也翻译为“红绿蓝”，比较少用)是工业界的一种颜色标准，是通过对红®、绿(G)、蓝(B)三个颜色通道的变化以及它们相互之间的叠加来得到各式各样的颜色的，RGB即是代表红、绿、蓝三个通道的颜色，这个标准几乎包括了人类视力所能感知的所有颜色，是目前运用最广的颜色系统之一。

【5】原文：分类与回归
分类问题输出的是物体所属的类别，回归问题输出的是物体的值。

天气可以分为：晴、阴、雨三类，我们会测明天及以后几天的天气情况，如明天阴，这就是分类；
我们知道今天及以前几天的温度，我们预测现在往后的温度，每一个时刻，我们都能预测出一个温度值，就是回归。

【6】原文：神经网络的输入输出

【7】原文
卷积核（kernel）：用于对输入图像进行共享权值的遍历；如果将图像每一个图像的每一个像素作为卷积输入层的元素，那么卷积核就相当与每个输入的权值，且有卷积核大小的一组输入使用同一组权值。例如，一个图像是99大小，卷积核是33；则输入是81个，共享权值是9个一组。

字符含义：i：输入的宽度，k:卷积核的宽度，p：单边填充宽度，o：输出宽度，s：步长

Miss Moonpence

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
【无标题】

DQN是DRL的其中一种算法，它要做的就是将卷积神经网络（CNN）和Q-Learning结合起来，CNN的输入是原始图像数据（作为状态State），输出则是每个动作Action对应的价值评估Value Function（Q值）。我们在训练模型的时候，通常先对卷积层进行随机的初始化，然后不断迭代卷积核和偏差。二维卷积层输出的二维数组可以看做是输入在空间维度上(宽和高)上某一级的表征，也叫特征图(feature map)。卷积窗口形状为 p × q 的卷积层称为 p × q 卷积层。
复制链接

扫一扫