神经网络：全连接神经网络

最新推荐文章于 2024-05-17 06:34:09 发布

置顶

Dive_

最新推荐文章于 2024-05-17 06:34:09 发布

阅读量5.9k

点赞数

分类专栏：机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_38119106/article/details/107712987

版权

本文介绍了全连接神经网络（多层感知机）的基础知识，包括神经元模型、网络结构、正向传播过程以及反向传播算法。在神经元部分，解释了权重、偏置及激活函数的作用。网络结构部分阐述了输入层、隐藏层和输出层的权重矩阵配置。正向传播中，描述了从输入到输出的计算流程。反向传播部分，详细解释了损失函数、梯度计算和权重更新的过程，强调了隐藏层梯度依赖于下一层的特点。

摘要由CSDN通过智能技术生成

目录

- - 1 简介

1 简介

全连接神经网络也称作多层感知机（MLP）

1.1 神经元

神经元接收输入向量 $x$
神经元节点有权重向量w和偏置项b 输出值为 $f(w^Tx+b)$
在经过类似线性回归之后使用激活函数对得到值进行操作

1.2 网络结构

在这里插入图片描述

输入层：[特征维度，n]
隐含层：权重矩阵 [输出维度，输入维度] 或者说[这层维度，上层维度]
输出层：[类别数，n]

个人对于每一层的理解就是使用[这层维度，上层维度]的权重矩阵
将输入转化为其他维度并且使用非线性的激活函数得到输出

1.3 正向传播

确定网络结构之后
假设有m层网络第 $l$ 层的权重矩阵 $W^l$ 偏置为 $b^l$
整个网络从输入到输出的流程为

$x^1=x$
对于 $l = 2, 3, . . . m$ 每一层
$u^l=W^lx^{l-1}+b^l$ （线性回归）
$x^l=f(u^l)$ （非线性激活函数）
得到 $x^m$ 即为输出可能是每个类别的概率组成的向量也可能是回归值

1.4 反向传播

如何训练每一层的W和b 就需要反向传播算法
假设单个样本的损失函数是：

最低0.47元/天解锁文章

关注

0
点赞
踩
24

收藏

觉得还不错? 一键收藏
0
评论
神经网络：全连接神经网络

目录1 简介1.1 神经元1.2 网络结构1.3 正向传播1.4 反向传播1 简介全连接神经网络也称作多层感知机（MLP）1.1 神经元神经元接收输入向量xxx神经元节点有权重向量w和偏置项b 输出值为f(wTx+b)f(w^Tx+b)f(wTx+b)在经过类似线性回归之后使用激活函数对得到值进行操作1.2 网络结构输入层：[特征维度，n]隐含层：权重矩阵 [输出维度，输入维度] 或者说[这层维度，上层维度]输出层：[类别数，n]个人对于每一层的理解就是使用[这层维度，上层
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。