八、【人工智能】【机器学习】【监督学习】-卷积神经网络 (CNN)

 系列文章目录

第一章 【机器学习】初识机器学习

第二章 【机器学习】【监督学习】- 逻辑回归算法 (Logistic Regression)

第三章 【机器学习】【监督学习】- 支持向量机 (SVM)

第四章【机器学习】【监督学习】- K-近邻算法 (K-NN)

第五章【机器学习】【监督学习】- 决策树 (Decision Trees)

第六章【机器学习】【监督学习】- 梯度提升机 (Gradient Boosting Machine, GBM)

第七章 【机器学习】【监督学习】-神经网络 (Neural Networks)

第八章【机器学习】【监督学习】-卷积神经网络 (CNN)

第九章【机器学习】【监督学习】-循环神经网络 (RNN)

第十章【机器学习】【监督学习】-线性回归

第十一章【机器学习】【监督学习】-局部加权线性回归 (Locally Weighted Linear Regression, LWLR)

第十二章【机器学习】【监督学习】- 岭回归 (Ridge Regression)


目录

系列文章目录

前言

一、基本定义

(一)、监督学习

(二)、监督学习的基本流程

(三)、监督学习分类算法(Classification)

二、卷积神经网络 (CNN)

(一)、定义

(二)、基本概念

(三)、训练过程

(四)、特点

(五)、适用场景

(六)、扩展

三、总结


前言

    在先前的文章系列中,我们深入探讨了机器学习的基础框架和算法分类,为读者构建了关于这一领域的坚实理论基础。本章节我们将焦点转向监督学习领域中的一个核心算法—— 卷积神经网络 (CNN),旨在详尽解析其内在逻辑、应用实践及重要参数调整策略。


一、基本定义

(一)、监督学习

        监督学习(Supervised Learning)是机器学习中的一种主要方法,其核心思想是通过已知的输入-输出对(即带有标签的数据集)来训练模型,从而使模型能够泛化到未见的新数据上,做出正确的预测或分类。在监督学习过程中,算法“学习”的依据是这些已标记的例子,目标是找到输入特征与预期输出之间的映射关系。

(二)、监督学习的基本流程

        数据收集:获取包含输入特征和对应正确输出标签的训练数据集。
        数据预处理:清洗数据,处理缺失值,特征选择与转换,标准化或归一化数据等,以便于模型学习。
        模型选择:选择合适的算法,如决策树、支持向量机、神经网络等。
        训练:使用训练数据集调整模型参数,最小化预测输出与实际标签之间的差距(损失函数)。
        验证与调优:使用验证集评估模型性能,调整超参数以优化模型。
        测试:最后使用独立的测试集评估模型的泛化能力,确保模型不仅在训练数据上表现良好,也能在未见过的新数据上做出准确预测。

(三)、监督学习分类算法(Classification)

        定义:分类任务的目标是学习一个模型,该模型能够将输入数据分配到预定义的几个类别中的一个。这是一个监督学习问题,需要有一组已经标记好类别的训练数据,模型会根据这些数据学习如何区分不同类别。
        例子:垃圾邮件检测(垃圾邮件 vs. 非垃圾邮件)、图像识别(猫 vs. 狗)。


二、卷积神经网络 (CNN)

(一)、定义

卷积神经网络(Convolutional Neural Networks, CNN)是一种专门设计用于处理具有类似网格结构(如图像)数据的深度学习模型。CNN 在其网络结构中至少包含一层卷积层,该层使用卷积运算代替传统的矩阵乘法。这种架构模仿了生物视觉系统的处理方式,特别是视网膜和视觉皮层中的细胞如何响应局部区域的刺激。

(二)、基本概念

  • 卷积层:包含多个卷积核(filter或kernel),每个卷积核在输入数据上滑动,执行点积操作,以检测不同的特征。
  • 池化层:通常位于卷积层之后,用于降低特征图的空间尺寸,减少计算量,同时保持重要特征信息。
  • 全连接层:在网络的末端,用于将前面提取的特征映射到具体的类别上,进行最终的分类或回归预测。
  • 激活函数:如ReLU,引入非线性,帮助网络学习更复杂的特征。

(三)、训练过程

  1. 初始化:随机初始化网络权重。
  2. 前向传播:输入数据通过网络各层,计算输出。
  3. 损失计算:使用损失函数(如交叉熵损失)衡量预测值与实际标签的差异。
  4. 反向传播:计算损失相对于每个权重的梯度。
  5. 权重更新:使用优化算法(如梯度下降或Adam)更新权重,以最小化损失。
  6. 迭代训练:重复上述步骤,直到满足停止条件(如达到预定的训练轮数或损失收敛)。

(四)、特点

  • 平移不变性:卷积核在输入数据上滑动,能够检测到相同的特征,不论其位置如何。
  • 参数共享:同一卷积层内所有特征检测器使用相同的权重集,减少了参数数量。
  • 稀疏连接:每个神经元仅与输入的一部分区域相连,这减少了计算复杂度。
  • 层次特征学习:深层网络能从低级特征中学习高级抽象特征。

(五)、适用场景

  • 图像识别:分类、物体检测、图像分割等。
  • 视频分析:动作识别、场景理解。
  • 自然语言处理:文本分类、情感分析、机器翻译。
  • 语音识别:语音转文字、说话人识别。
  • 医学影像分析:疾病诊断、图像重建。

(六)、扩展

  • 深度可分离卷积:通过深度卷积和逐点卷积分离标准卷积,减少参数量。
  • 残差网络(ResNet):通过跳跃连接避免梯度消失问题,允许训练更深的网络。
  • 注意力机制:允许网络专注于输入的某些部分,提高模型的解释性和性能。
  • 时空卷积网络(STCN):结合时间和空间维度的卷积,适用于视频等时序数据。

三、总结

        随着CNN 的不断发展和创新,也拓展了其应用范围,使其在医疗影像分析、自动驾驶、虚拟现实、增强现实、艺术创作等众多领域展现出巨大的潜力和影响力。随着计算硬件的不断进步和算法的持续优化,CNN将继续在人工智能领域发挥核心作用。

   更多内容,防止走丢,请关注公众号,公众号会持续更新各类技术内容和职场介绍:

                                             

码上云游

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值