深度学习基础

最新推荐文章于 2020-10-07 00:22:07 发布

linolzhang

最新推荐文章于 2020-10-07 00:22:07 发布

阅读量4.5k

点赞数 10

分类专栏：深度学习深度学习基础文章标签：深度学习深度学习入门神经网络深度学习基础 deep learning

本文链接：https://blog.csdn.net/linolzhang/article/details/54343368

版权

本文介绍了深度学习的基础，起源于神经网络，深入讲解了神经元的工作原理和激活函数的重要作用。激活函数如sigmoid、tanh、ReLU和Softplus用于引入非线性，解决线性函数在数据拟合上的局限性。此外，文章还探讨了目标函数、梯度下降法和反向传播算法在训练神经网络中的应用，以及深度学习中多层神经网络的挑战和解决方案。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

AI技术研究的兴起，伴随着两种最直观的思维技巧，即遗传算法与神经网络，这是对生物学研究最直观的技术抽象。深度学习的前身就是神经网络，这个80年代灵光乍现的技术，在那一波人工智能的大潮驱使下，带着人们对于未来AI时代的憧憬，迅速蔓延，一时风头无两，和今天深度学习的火热几乎如出一辙。

某乎友的观点给出了这两种技术的鲜明对比，如同麻汁与芝麻酱，换汤不换药，所谓深度在于把二两变成了三斤，给出的官方解释是深度学习只是依赖于大数据和更好的硬件，除此再无区别。

当然也有不同观点，但不管如何，这并不是我们要讨论的话题，只要捋清来龙去脉，请读者自己站队。

• 神经网络

生物学家对人体大脑研究发现，人脑存在860亿个神经元，复杂的神经元通过生物电驱动，实现消息的加工和处理，神经元是怎么处理信息的呢？通过神经元结构来进行说明：

1）神经元作为信息处理的基本结构，主要构件是树突，细胞体和轴突，树突及细胞体接收外部刺激信号（由其他神经元传递）；

2）轴突的作用过程是信号处理的过程，这个过程不完全是一种线性的处理过程，而是存在一种潜在的拟合方法，实现信号的放大或者抑制，也有可能出现信号消失，因此这种处理过程带有较大的随机性；

3）突触实现信号的向下传递，当前面的信号处理后仍然存在时，将信号传递到相连接的神经元；

4）由于每个神经元对其他神经元产生的刺激或者抑制，最初的信号得到加工，这个加工过程非常复杂，路径也很深，有人把这个过程称为一个“图灵机”。

基于生物神经学的研究，神经网络的概念诞生，被抽象成数学符号，描述为以加权平均形式，而信号加工处理过程被简化为单向网络，如下图所示：