深度学习基础（一）神经网络基本原理

昊昊该干饭了

已于 2024-02-23 16:44:36 修改

阅读量1.7w

点赞数 25

分类专栏：人工智能 python 深度学习文章标签：深度学习神经网络人工智能

于 2024-02-22 16:02:25 首次发布

本文链接：https://blog.csdn.net/qq_52213943/article/details/136235053

版权

python 同时被 3 个专栏收录

124 篇文章

订阅专栏

人工智能

29 篇文章

订阅专栏

深度学习

20 篇文章

订阅专栏

本文介绍了深度学习的基础知识，包括监督与非监督学习的区别，深度学习的兴起，神经网络模型如神经元、网络结构、前向传播、反向传播和梯度下降，以及卷积神经网络（CNN）的应用。文章强调深度学习在复杂任务中的优势和实际案例。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

之前的章节我们初步介绍了机器学习相关基础知识，目录如下：

机器学习基础（一）理解机器学习的本质-CSDN博客

机器学习基础（二）监督与非监督学习-CSDN博客

机器学习基础（四）非监督学习的进阶探索-CSDN博客机器学习基础（三）监督学习的进阶探索-CSDN博客

机器学习基础（四）非监督学习的进阶探索-CSDN博客

机器学习基础（五）监督与非监督学习的结合-CSDN博客

机器学习基础（六）TensorFlow与PyTorch-CSDN博客

从这一节开始，我们开始介绍了深度学习相关基础知识。请注意，本节代码示例旨在说明概念，并不是实际应用中的最佳选择。在实际应用中，通常会使用更高级的库和框架，如TensorFlow或PyTorch，来构建和训练神经网络。

与机器学习比较

深度学习简介

深度学习是机器学习中的一个子集，它通过使用称为神经网络的结构，特别是深层神经网络，来模拟人类大脑处理信息的方式。深度学习的“深度”指的是网络中层的数量，这些层可以自动并且有效地学习数据的多层次特征表示。深度学习在许多复杂的任务中表现出了卓越的性能，如图像和语音识别、自然语言处理和无人驾驶汽车技术。

两者的关系

机器学习和深度学习的关系可以通过俄罗斯套娃来形象地描述：深度学习是机器学习的一个子集，而机器学习本身又是人工智能的子集。所有深度学习都是机器学习，但并非所有机器学习都是深度学习。

从机器学习到深度学习

传统的机器学习模型依赖于手工提取的特征和数据表示，这要求领域专家深入了解问题。相比之下，深度学习模型通过足够深的神经网络自动学习特征表示，减少了对领域知识的依赖。这种自动特征学习使深度学习在处理复杂和高维数据时，如图像、声音和文本，表现出了显著的优势。

深度学习的兴起

深度学习之所以能够取得突破性的进展，归功于以下几个关键因素：大量的数据集、强大的计算能力和算法的创新。大数据的可用性为深度学习模型的训练提供了丰富的“经验”，而GPU和其他专用硬件的发展则显著加速了这些模型的训练过程。此外，算法上的创新，如卷积神经网络（CNN）和长短期记忆网络（LSTM），为特定类型的数据和任务提供了高效的模型架构。

机器学习与深度学习的选择

尽管深度学习在许多任务上取得了巨大成功，但这并不意味着它适用于所有问题。在某些情况下，传统的机器学习算法（如决策树、随机森林和支持向量机）可能更加有效和适合。选择使用机器学习还是深度学习取决于多个因素，包括数据的复杂性、任务的性质、可用的计算资源和所需的准确性。

神经网络

在人工智能领域，神经网络技术模仿人脑的处理方式，已经成为最令人兴奋的进步之一。这种技术的应用范围从简单的日常任务自动化到复杂的决策过程和模式识别，涵盖了医学、金融、自动驾驶车辆等多个领域。神经网络的核心原理启发于我们对人脑工作机制的理解，通过模拟神经元之间的连接来处理和存储信息。

神经元模型

生物神经元概述

生物神经元是人脑中的基本单位，由细胞体、树突和轴突组成。树突接收来自其他神经元的信号，细胞体处理这些信号，轴突将处理后的信号传递给其他神经元。这种高效的信息传递机制激发了人工神经元的设计。

人工神经元

人工神经元模仿生物神经元的功能，接收一组输入，通过加权和并应用激活函数处理这些输入，最后产生输出。这个过程可以用以下数学模型表示：

神经元模型代码示例

这个简单的Python函数演示了一个基本的神经元模型，它接收一组输入和相应的权重，然后应用一个激活函数（这里使用Sigmoid函数）来计算输出。

import numpy as np

def sigmoid(x):
    """Sigmoid激活函数"""
    return 1 / (1 + np.exp(-x))

def neuron_output(weights, inputs):
    """单个神经元的输出计算"""
    return sigmoid(np.dot(weights, inputs))

网络结构

神经网络通过层次化的神经元组织起来，形成从简单到复杂的结构。

层次结构

输入层：接收原始数据。
隐藏层：一个或多个，进行数据加工和特征提取。
输出层：产生最终结果。

常见网络结构

前馈神经网络（FNN）：数据单向流动，从输入层到输出层。
卷积神经网络（CNN）：特别适合处理图像数据。
递归神经网络（RNN）：处理序列数据，如时间序列或文本。

前向传播

前向传播是数据在神经网络中从输入到输出的流动过程。每一层的输出都依赖于其输入、层内神经元的权重和偏置项，以及激活函数。这个过程可以通过层层计算实现，直到达到输出层。

计算过程

输入层：接收输入数据。
隐藏层：计算加权和，应用激活函数。
输出层：生成最终预测结果。

前向传播代码示例

这个示例展示了如何在一个简单的神经网络中实现前向传播。这个网络包括输入层、一个隐藏层和输出层。

def forward_propagation(network, inputs):
    """简单的前向传播实现"""
    activations = inputs
    for layer in network:
        # 添加偏置项
        activations = np.dot(layer['weights'], activations) + layer['bias']
        # 应用激活函数
        activations = sigmoid(activations)
    return activations

# 示例网络结构
network = [
    {"weights": np.array([0.2, 0.4, 0.6]), "bias": np.array([0.1])},  # 隐藏层
    {"weights": np.array([0.5, 0.6]), "bias": np.array([0.2])}        # 输出层
]

# 输入向量
inputs = np.array([0.5, 0.3, 0.2])

# 前向传播计算
output = forward_propagation(network, inputs)
print("Network output:", output)

反向传播

反向传播是训练神经网络的核心机制，用于优化权重，以减少预测值和实际值之间的差异。这个过程涉及以下步骤：

计算误差：评估输出层的误差。
传播误差：将误差从输出层反向传递到输入层，途中更新每个神经元的权重。

梯度下降

权重的更新依赖于梯度下降算法，该算法通过计算损失函数相对于每个权重的梯度来调整权重，以最小化误差。

反向传播代码示例

反向传播是一个相对复杂的过程，涉及到计算损失函数相对于每个权重的梯度，并根据这些梯度更新权重。以下是一个简化的反向传播过程示例。

def backward_propagation(network, inputs, expected_output):
    """简单的反向传播实现"""
    outputs = forward_propagation(network, inputs)
    error = expected_output - outputs
    
    for i, layer in reversed(list(enumerate(network))):
        # 计算当前层的误差
        layer_error = error * outputs * (1.0 - outputs)
        error = np.dot(layer['weights'].T, layer_error)
        # 更新权重和偏置项
        layer['weights'] += layer_error * inputs.T
        layer['bias'] += layer_error

# 假设的期望输出
expected_output = np.array([0.8])

# 反向传播权重更新
backward_propagation(network, inputs, expected_output)