![](https://img-blog.csdnimg.cn/20201014180756918.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
神经网络与深度学习案例与实践(邱锡鹏的蒲公英书)
文章平均质量分 96
深度学习在很多领域中都有非常出色的表现,在图像识别、语音识别、自然语言处理、机器人、广告投放、医学诊断和金融等领域都有广泛应用。而目前深度学习的模型还主要是各种各样的神经网络。随着网络越来越复杂,从底层开始一步步实现深度学习系统变得非常低效,其中涉及模型搭建、梯度求解、并行计算、代码实现等多个环节。
绿洲213
springboot3只支持jdk17
展开
-
第5章(下)基于残差网络完成图像分类任务
CIFAR-10数据集包含了10种不同的类别、共60,000张图像,其中每个类别的图像都是6000张,图像大小均为32×3232\times3232×32像素。CIFAR-10数据集的示例如图5.15所示。图5.15:CIFAR-10数据集示例# 解压数据集 # 初次运行时将注释取消,以便解压文件 # 如果已经解压过,不需要运行此段代码,否则由于文件已经存在,解压时会报错!这里使用自定义的模型进行图像分类实验,观察两者结果是否一致。原创 2023-02-01 12:20:44 · 677 阅读 · 0 评论 -
第5章(上)卷积神经网络理论解读
卷积神经网络(Convolutional Neural Network,CNN)是受生物学上感受野机制的启发而提出的。目前的卷积神经网络一般是由卷积层、汇聚层和全连接层交叉堆叠而成的前馈神经网络,有三个结构上的特性:局部连接、权重共享以及汇聚。这些特性使得卷积神经网络具有一定程度上的平移、缩放和旋转不变性。和前馈神经网络相比,卷积神经网络的参数更少。卷积神经网络主要应用在图像和视频分析的任务上,其准确率一般也远远超出了其他的神经网络模型。近年来卷积神经网络也广泛地应用到自然语言处理、推荐系统等领域。原创 2023-02-01 10:51:33 · 587 阅读 · 0 评论 -
第4章(下)基于前馈神经网络完成鸢尾花分类任务
由于这里使用随机梯度下降法对参数优化,所以数据以批次的形式输入到模型中进行训练,那么评价指标计算也是分别在每个批次进行的,要想获得每个epoch整体的评价结果,需要对历史评价结果进行累积。本章介绍前馈神经网络的基本概念、网络结构及代码实现,利用前馈神经网络完成一个分类任务,并通过两个简单的实验,观察前馈神经网络的梯度消失问题和死亡ReLU问题,以及对应的优化策略。为了减少每次迭代的计算复杂度,我们可以在每次迭代时只采集一小部分样本,计算在这组样本上损失函数的梯度并更新参数,这种优化方式称为。原创 2023-01-28 14:59:46 · 276 阅读 · 0 评论 -
第4章(上)前馈神经网络理论解读
虽然我们能够通过模块化的方式比较好地对神经网络进行组装,但是每个模块的梯度计算过程仍然十分繁琐且容易出错。在深度学习框架中,已经封装了自动梯度计算的功能,我们只需要聚焦模型架构,不再需要耗费精力进行计算梯度。飞桨提供了类,来方便快速的实现自己的层和模型。模型和层都可以基于扩充实现,模型只是一种特殊的层。继承了类的算子中,可以在内部直接调用其它继承类的算子,飞桨框架会自动识别算子中内嵌的类算子,并自动计算它们的梯度,并在优化时更新它们的参数。下面我们使用Paddle的预定义算子来重新实现二分类任务。原创 2023-01-27 20:08:39 · 503 阅读 · 0 评论 -
第3章(下)基于Softmax回归完成鸢尾花分类任务
在本节,我们用入门深度学习的基础实验之一“鸢尾花分类任务”来进行实践,使用经典学术数据集Iris作为训练数据,实现基于Softmax回归的鸢尾花分类任务。实践流程主要包括以下7个步骤:数据处理、模型构建、损失函数定义、优化器构建、模型训练、模型评价和模型预测等,说明:使用深度学习进行实践时的操作流程基本一致,后文不再赘述。本实践的主要配置如下:Iris数据集,也称为鸢尾花数据集,包含了3种鸢尾花类别(Setosa、Versicolour、Virginica),每种类别有50个样本,共计150个样本。其中每个原创 2023-01-17 14:11:05 · 1665 阅读 · 5 评论 -
第3章(上)线性分类理论解读
基于RunnerV1,本章的RunnerV2类在训练过程中使用梯度下降法进行网络优化,模型训练过程中计算在训练集和验证集上的损失及评估指标并打印,训练过程中保存最优模型。不同于线性回归中直接使用最小二乘法即可进行模型参数的求解,Logistic回归需要使用优化算法对模型参数进行有限次地迭代来获取更优的模型,从而尽可能地降低风险函数的值。Logistic回归模型其实就是线性层与Logistic函数的组合,通常会将 Logistic回归模型中的权重和偏置初始化为0,同时,为了提高预测样本的效率,我们将。原创 2023-01-16 23:17:09 · 413 阅读 · 0 评论 -
第2章(下)基于线性回归完成波士顿房价预测任务
通过上面的实践,我们可以看到,在一个任务上应用机器学习方法的流程基本上包括:数据集构建、模型构建、损失函数定义、优化器、模型训练、模型评价、模型预测等环节。为了更方便地将上述环节规范化,我们将机器学习模型的基本要素封装成一个Runner类。除上述提到的要素外,再加上模型保存、模型加载等功能。Runner__init__函数:实例化Runner类时默认调用,需要传入模型、损失函数、优化器和评价指标等;train函数:完成模型训练,指定模型训练需要的训练集和验证集;原创 2023-01-16 23:17:56 · 970 阅读 · 1 评论 -
第2章(上)线性回归理论解读
机器学习(Machine Learning,ML)就是让计算机从数据中进行自动学习,得到某种知识(或规律)。作为一门学科,机器学习通常指一类问题以及解决这类问题的方法,即如何从观测数据(样本)中寻找规律,并利用学习到的规律(模型)对未知或无法观测的数据进行预测。在学习本章内容前,建议您先阅读《神经网络与深度学习》第 2 章:机器学习概述的相关内容,关键知识点如图2.1所示,以便更好的理解和掌握相应的理论知识,及其在实践中的应用方法。本章内容基于《神经网络与深度学习》第 2 章:机器学习概述 相关内容进行设计原创 2023-01-06 15:03:13 · 192 阅读 · 0 评论 -
第1章 实践基础
深度学习在很多领域中都有非常出色的表现,在图像识别、语音识别、自然语言处理、机器人、广告投放、医学诊断和金融等领域都有广泛应用。而目前深度学习的模型还主要是各种各样的神经网络。随着网络越来越复杂,从底层开始一步步实现深度学习系统变得非常低效,其中涉及模型搭建、梯度求解、并行计算、代码实现等多个环节。每一个环节都需要进行精心实现和检查,需要耗费开发人员很多的精力。为此,深度学习框架(也常称为机器学习框架)应运而生,它有助于研发人员聚焦任务和模型设计本身,省去大量而烦琐的代码编写工作,其优势主要表现在如下两个方原创 2023-01-05 12:38:06 · 455 阅读 · 5 评论