Matlab深度学习工具箱的使用

最新推荐文章于 2024-07-21 09:55:44 发布

qq_1254664473

最新推荐文章于 2024-07-21 09:55:44 发布

阅读量3.1k

点赞数 1

文章标签：深度学习

本文链接：https://blog.csdn.net/qq_49438230/article/details/123750326

版权

模型背景

输入x为一个有12维的向量，样本数量假设为1000
输出y 为9个不同的类型
想通过神经网络进行分类

数据导入

输入为12维的，即特征值有12个，样本数量为1000个。
如果使用Mini-Batch的概念，可以将其分为若干个Batch，也就是分成若干个块，这里的训练集分为了270个Batch，每个Batch的大小不一样，第一个Batch为127，第二个为129，但有两个这样大小的Batch。这里可以随意搭配，这样的随机性应该可以对训练结果的正确性有提升（存疑），下图为每个Batch的情况

可以看到每个Batch的大小和相同类型的Batch都不一样，一共是270个Batch，注意横坐标为输入的维度，也就是特征值。每个Batch所对应的只能是一个类别，比如第一个大小为127的Batch，这里的7个样本都对应一个类别，而不是多个类别，这里实际上对应着的是3，也就是对应第三个类型。当然第二个Batch也可以随意对应着类别，可以是3，也可以是其他的类别，这个根据实际情况进行划分。但尤其要注意的是每一个Batch的12个特征值是对应着一个类别，即是说这里的一列是一个类型，而不是一行，这里每一行对应的是每一个样本中的一个特征值或者说是第一个特征值。其关系如下图所示

可以看到这里的一个Batch的每个样本的12个特征值是对应着相同的类型。其实这里对应相同的类型也是为了在划分的方便，不然在训练集的类别y值中就无法用一个类别y对应一个Batch。下图为类别y在每个Batch所对应的值

可以看到这是一个2701一个categorical类型的，这是和之前的训练集的x的每个Batch相对应的。即第一个Batch对应着类别3，第二个Batch对应着类别3，以此类推就可以列出每个batch所对应的类别了。

网络模型的搭建

模型初步设置了四层，第一层为序列输入层，第二层为全连接层，第三层为softmax层，第四层为分类输出层。
输入层主要是对数据的导入，通过这个模块可以使输入到达全连接层，注意输入的维度，这里的维度应该是特征值的个数，即取12，那么全连接层的输入层也应该是12，应和输入的维度相对应。全连接层的输出为9，和类别y相对应。然后通过softmax层对全连接层的输出进行计算。最后通过输出层进行类别的输出。

深度学习的数学模型

全连接层的作用就是起到一个映射的作用，这里是将维度为12的特征值映射成维度为9的类别，其关系是成线性的。神经网络说到底就是找到这个变换矩阵，即各个权重，最后的权重矩阵是要能够筛选出不同样本的12个特征值所对应的类别y，y是9维的，但只有1个维度的值是最接近1的。
这里将全连接层的输出记作 $z_i$ ，softmax层的输出记作 $y_i$ 。
全连接层的数学模型为 $z_i =\omega *x_i +b$ softamx的数学模型为 $y_i =\frac{e^{z_i } }{\sum_{i\;=\;1}^9 e^{z_i } }$ 其中 $i$ 为 $1 - 9$ ， $y_i$ 是大于0小于1，并且所有的 $y$ 相加为1。
深度学习分类的过程分为3个阶段，第一个阶段是先随机取权重，通过线性层（全连接层）进行计算；第二个阶段是对每个连接求导（梯度），第三个阶段是用梯度对权重进行更新。值得注意的是更新权重的时候，可以在梯度的前面乘以一个学习率 $\alpha$ ，以达到较好的效果。即 $\omega =\omega -\alpha *\frac{\mathrm{dloss}}{d\omega }$ 对于两分类的 $l o s s$ 的基本公式为 $\mathrm{loss}=-\left(y*\mathrm{log}\hat{y} +\left(1-y\right)*\mathrm{log}\left(1-\hat{y} \right)\right)$ 对于两分类的Mini-Batch而言，其 $l o s s$ 为 $\mathrm{loss}=-\frac{1}{N}\sum_{n=1}^N \left(y*\mathrm{log}\hat{y} +\left(1-y\right)*\mathrm{log}\left(1-\hat{y} \right)\right)$ 其实损失函数 $l o s s$ 可以就看成是 $\mathrm{loss}=-y*\mathrm{log}\left(\hat{y} \right)$ 因为当 $y = 1$ 时， $1 - y = 0$ .
其中 $\hat{y}$ 为预测值，即上面说提到的 $z_i$ ，N为Batch的个数。

qq_1254664473

关注

1
点赞
踩
10

收藏

觉得还不错? 一键收藏
2
评论
Matlab深度学习工具箱的使用

这里写自定义目录标题欢迎使用Markdown编辑器新的改变功能快捷键合理的创建标题，有助于目录的生成如何改变文本的样式插入链接与图片如何插入一段漂亮的代码片生成一个适合你的列表创建一个表格设定内容居中、居左、居右SmartyPants创建一个自定义列表如何创建一个注脚注释也是必不可少的KaTeX数学公式新的甘特图功能，丰富你的文章UML 图表FLowchart流程图导出与导入导出导入欢迎使用Markdown编辑器你好！这是你第一次使用 Markdown编辑器所展示的欢迎页。如果你想学习如何使用Mar
复制链接

扫一扫