作者:禅与计算机程序设计艺术
1.简介
1.1 前言
一直以来,人工智能的研究工作都围绕着计算机视觉、自然语言处理等领域,而深度学习(Deep Learning)的火热也不断吸引着科研人员的目光。近年来,基于神经网络结构的图像识别技术在很多领域取得了突破性进步。但同时,随着传统机器学习模型的推广应用,越来越多的复杂场景需要依赖于强大的计算能力才能解决,这就要求基于深度学习的新型机器学习模型能够准确、快速地适应新的应用场景。因此,如何更好地理解、掌握、运用深度学习方法已经成为当下热门话题之一。为了帮助读者更好地了解相关知识,本文试图对深度学习相关的知识进行全面梳理并提供一些典型的案例,让大家能够更容易理解、掌握和运用深度学习方法。
1.2 深度学习的特点
深度学习的主要特点包括:
- 模型深度(Depth):深层次网络带来的特征提取能力,可以从原始输入数据中抽象出丰富的高级特征;
- 数据增强(Augmentation):训练样本不足时,通过对数据进行旋转、翻转、缩放等方式进行数据扩充,提升模型的泛化性能;
- 梯度消失/爆炸(Vanishing gradient/Exploding gradient):通过激活函数的设计,如ReLU、Leaky ReLU等,将非线性转换为线性;
- 归纳偏差(Overfitting):为了使得网络能够“记住”训练数据中的规律性,加入正则项或Dropout等方法防止过拟合;
- 参数共享