《深度学习入门——基于python的理论与实现》读书笔记（三）

最新推荐文章于 2023-12-20 11:25:46 发布

__Lysias__

最新推荐文章于 2023-12-20 11:25:46 发布

阅读量366

点赞数

分类专栏：机器学习文章标签： deeplearning python

本文链接：https://blog.csdn.net/weixin_42156883/article/details/86638115

版权

8 篇文章 2 订阅

订阅专栏

神经网的节点，神经元

如图所示，神经元与感知机的区别是激活函数，即h，不同。感知机的激活函数是阶跃函数：

对应感知机部分出现的阈值函数：

$y= \begin{cases} 0& \test{w_1x_1+w_2x_2\leq0}\\ 1& \text{other} \end{cases}$

而神经元使用sigmoid函数：

def sigmoid(x):
    return 1 / (1 + np.exp(-x))

还可以使用ReLU：

对整个数组使用，转化为e的幂，再计算占比。公式为，

$y_k=\frac{e^{a_k}}{\sum_{i=1}^{n}e^{a_i}}$

在分类问题中，神经网络为每个类别输出一个预测值。这个预测值组成的数组经softmax处理后，可以看作每个类别的概率。当然，由于指数函数单调递增，看作概率的隐含的前提是，本来某类别的预测值越大表示该类别的可能性越大（对某个输入来说）。

由于指数函数的参与，一个稍大些的正数就会使浮点数溢出。解决办法是，

这里，可以令

$C^{'}=-mean(a_i)$

即，通过预处理，使数据的均值为零，

def softmax(x):
    c = np.mean(x) # 防止溢出
    exp_x = np.exp(x - c) 
    sum_exp_x = np.sum(exp_x) # 计算总和
    return exp_x / sum_exp_x # 计算占比

著名的手写数字图像集。

关注

专栏目录