多层感知机和神经网络的区别_情感分析之多层全连接神经网络

本文详细介绍了多层感知机(MLP)与全连接神经网络的区别,并探讨了激活函数如ReLU、sigmoid和tanh的作用。通过Keras的情感分析案例,展示了全连接神经网络在训练情感分析模型中的应用,包括使用交叉熵损失函数和Adam优化器。
摘要由CSDN通过智能技术生成

全连接神经网络

全连接神经网络是一种最基本的神经网络结构,英文为Full Connection,所以一般简称FC。FC的准则很简单:神经网络中除输入层之外的每个节点都和上一层的所有节点有连接。

6b83b33a7c10010dcd02f0c25e556619.png

上图是一个双隐层的前馈全连接神经网络,或者叫多层感知机 (MLP)。它的每个隐层都是全连接层。它的每一个单元叫神经元。多层感知机在单层神经网络的基础上引入了一到多个隐藏层(hidden layer)。隐藏层位于输入层和输出层之间。

014c9b81cc6a61fb1e44f173998db1ba.png

在上图所示的多层感知机中,输入和输出个数分别为4和3,中间的隐藏层中包含了5个隐藏单元(hidden unit)。由于输入层不涉及计算,图中的多层感知机的层数为2。由图可见,隐藏层中的神经元和输入层中各个输入完全连接,输出层中的神经元和隐藏层中的各个神经元也完全连接。因此,多层感知机中的隐藏层和输出层都是全连接层。

具体来说,给定一个小批量样本

a19dd009b7d52839db70e5960e91e0ca.png

,其批量大小为 n ,输入个数为 d 。假设多层感知机只有一个隐藏层,其中隐藏单元个数为 h 。记隐藏层的输出(也称为隐藏层变量或隐藏变量)为 H ,有

5b7cfb5a1ffac4ca4c7a27eea001786a.png

。因为隐藏层和输出层均是全连接层,可以设隐藏层的权重参数和偏差参数分别为

2c327bf3f7b37082ca2a33737d8423cc.png

5b3f1538986e44b6dc15213654881503.png

,输出层的权重和偏差参数分别为

2becff105fb467095858405fde6f0493.png

5b3f1538986e44b6dc15213654881503.png

我们先来看一种含单隐藏层的多层感知机的设计。其输出的计算为:

c6c632e3d91a47e16e808d83b1a00610.png
b039c519fb219033fb8ed6cc89fe7c0f.png

也就是将隐藏层的输出直接作为输出层的输入。如果将以上两个式子联立起来,可以得到

03f125aa441553ea93fbc3dc60a60be3.png

从联立后的式子可以看出,虽然神经网络引入了隐藏层,却依然等价于一个单层神经网络:其中输出层权重参数为

9155e698246930a208a406574f3efb0a.png

,偏差参数为

5fd89031795ef3d06ec6fd52e340e151.png

。不难发现,即便再添加更多的隐藏层,以上设计依然只能与仅含输出层的单层神经网络等价。

激活函数

全连接层只是对数据做仿射变换(affine transformation),而多个仿射变换的叠加仍然是一个仿射变换。解决问题的一个方法是引入非线性变换,例如对隐藏变量使用按元素运算的非线性函数进行变换,然后再作为下一个全连接层的输入。这个非线性函数被称为激活函数(activation function)。下面我们介绍几个常用的激活函数。

ReLU函数

ReLU(rectified linear unit)函数提供了一个很简单的非线性变换。给定元素 x ,该函数定义为:

069b7054cd00a8de57fabb01ce9c98dc.png

可以看出&#x

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值