【神经网络入门】前向传播：激活函数和输出层设计

最新推荐文章于 2024-05-17 11:12:50 发布

沐兮Krystal

最新推荐文章于 2024-05-17 11:12:50 发布

阅读量647

点赞数 1

分类专栏： NLP 文章标签：神经网络 numpy python

本文链接：https://blog.csdn.net/GW_Krystal/article/details/125498025

版权

NLP 专栏收录该内容

27 篇文章 16 订阅

订阅专栏

神经网络中使用的激活函数

转换器，进行信号的转换，转换后的信号传送给下一个神经元。

阶跃函数的实现：

def step_function(x): # 输入NumPy数组
	y = x > 0 # 对NumPy数组进行不等号运算，生成一个布尔型数组
	return y.astype(np.int) # 把数组y的元素类型从布尔型转换为int型

用图来表示阶跃函数：

import numpy as np
import matplotlib.pylab as plt

def step_function(x):
	return np.array(x>0,dtype=np.int) # 以数组形式返回结果

x = np.arange(-5.0,5.0,0.1)
y = step_function(x)

plt.plot(x, y)
plt.ylim(-0.1, 1.1) # 指定y轴范围
plt.show()

在这里插入图片描述

sigmoid函数的实现：

$h(x)=\frac{1}{1+exp(-x)}$

def sigmoid(x):
	return 1 / (1 + np.exp(-x))

该函数能支持NumPy数组。（NumPy的广播功能）
在这里插入图片描述

sigmoid的平滑性对神经网络的学习具有重要意义。
感知机中流动的是0或1的二元信号，而神经网络中流动的是连续的实值信号。

输出层的设计

神经网络可以用在分类和回归问题上，不过需要根据情况改变输出层的激活函数。
一般而言，回归问题用恒等函数，分类问题用softmax函数。
softmax函数可以用下面的式子表示：
$y_k=\frac{exp(a_k)}{\sum_{i=1}^{n}exp(a_i) }$
假设输出层共有 $n$ 个神经元，计算第 $k$ 个神经元的输出 $y_k$ 。
softmax函数的分子是输入信号 $a_k$ 的指数函数，分母是所有输入信号的指数函数的和。

def softmax(a):
    exp_a = np.exp(a)  # 指数函数
    sum_exp_a = np.sum(exp_a)
    y = exp_a / sum_exp_a

    return y

实现softmax函数时的注意事项：

上文的实现存在缺陷，溢出问题。
可以这样进行改进：
$y_k=\frac{exp(a_k)}{\sum_{i=1}^{n}exp(a_i) } =\frac{Cexp(a_k)}{C\sum_{i=1}^{n}exp(a_i) } =\frac{exp(a_k+\log_{}{C} )}{\sum_{i=1}^{n}exp(a_i+\log_{}{C}) } =\frac{exp(a_k+C' )}{\sum_{i=1}^{n}exp(a_i+C') }$
该式说明，在进行softmax的指数函数的运算时，加上（或者减去某个常数不会改变运算的结果）。
可以通过减去输入信号的最大值来实现：

def softmax(a):
    c = np.max(a)
    exp_a = np.exp(a-c) # 溢出对策
    sum_exp_a = np.sum(exp_a)
    y = exp_a / sum_exp_a
    
    return y

一般而言，神经网络只把输出值最大的神经元所对应的类别作为识别结果。并且，即便使用softmax函数，输出值最大的神经元的位置也不会变。
因此，推理阶段输出层的softmax函数可以省略。
在输出层使用softmax函数是因为它和神经网络的学习有关系。

输出层的神经元数量：

对于分类问题，输出层的神经元数量一般设定为类别的数量。

沐兮Krystal

关注

1
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
【神经网络入门】前向传播：激活函数和输出层设计

转换器，进行信号的转换，转换后的信号传送给下一个神经元。用图来表示阶跃函数：该函数能支持NumPy数组。（NumPy的广播功能）sigmoid的平滑性对神经网络的学习具有重要意义。感知机中流动的是0或1的二元信号，而神经网络中流动的是连续的实值信号。神经网络可以用在分类和回归问题上，不过需要根据情况改变输出层的激活函数。一般而言，回归问题用恒等函数，分类问题用softmax函数。...
复制链接

扫一扫

专栏目录