深度学习在2D视觉领域分类

深度学习---2D视觉领域分类_深度学习

一、图像分类

图像分类是指将数字图像自动分类到不同的预先定义类别中。

深度学习---2D视觉领域分类_人工智能_02

二、目标检测

目标检测是指在图像或视频中自动识别和定位特定物体的任务。与图像分类不同,它不仅需要确定物体的类别,还需要找出物体在图像中的位置。

按照框分类又可以分为平行框检测和旋转框检测

  • 平行框

深度学习---2D视觉领域分类_语言模型_03

  • 旋转框

深度学习---2D视觉领域分类_分类_04

平行框和旋转框对比

深度学习---2D视觉领域分类_ai_05

三、图像分割

图像分割是指将数字图像中的像素划分为不同的区域或对象的过程。

深度学习---2D视觉领域分类_深度学习_06

  • 语义分割
    对图片中每个像素分配一个语义标签(类别)
  • 实例分割
    实例分割可以理解成目标检测和语义分割的结合,其检测出每个对象的位置,并用分割掩膜(mask)表示每个对象所在区域,同一类别中的不同物体表示为不同的实例
  • 全景分割
    可以理解成语义分割和实例分割的结合,即每个像素都分配一个语义标签和一个实例ID,语义标签和实例ID都相同的像素认为是属于同一个对象。
四、测验

深度学习---2D视觉领域分类_ai_07