计算机视觉中的五大任务


参考资料

人工智能中图像分类、目标检测、语义分割和实例分割等任务是什么?

图像分类、目标检测、语义分割、实例分割等计算机视觉方向基本概念


前言

 近年来,计算机视觉及其相关领域发展十分迅速,相关技术已经被应用到人类生产和生活的各个领域。我们耳熟能详的任务有人脸识别、步态识别、虹膜识别、车辆检测以及医学图像处理等。 实际上,计算机视觉本身包含众多的研究方向,本文仅仅介绍下面几个互相关联的任务:

  • 图像分类:Image Classification
  • 语义分割:Semantic Segmentation
  • 目标检测:Object Detection
  • 实例分割:Instance Segmentation
  • 全景分割:Panoptic Segmentation

 下图展示了图像分类、语义分割、目标检测、实例分割四种任务:
在这里插入图片描述

  • 图像分类:判别图中物体是什么,比如是猫还是狗;
  • 语义分割:对图像进行像素级分类,预测每个像素属于的类别,不区分个体
  • 目标检测:寻找图像中的物体并进行定位
  • 实例分割:定位图中每个物体,并进行像素级标注,区分不同个体

一、图像分类(Object Classification)

(1)概念

 图像分类任务目的是判断图像中包含物体的类别,如果期望判别多种物体则称为多目标分类
 下图中含有多种物体,分类任务的目标可以是判断图片中是否含有“狗”。
在这里插入图片描述
(2)常用算法:KNN、SVM、BP 神经网络、CNN 和迁移学习;

(3)常用数据集:ImageNet、MNIST、Caltech 101;


二、语义分割(Semantic Segmentation)

(1)概念
 语义分割任务需要对图像中所有像素点进行分类,将相同类别的像素归为相同的标签(常常采用相同的像素点表示),但是同一物体的不同实例不需要单独分割出来

语义分割只能判断类别,无法区分个体

在这里插入图片描述

(2)常用算法:FCN、U-Net、SegNet

(3)常用数据集:PASCAL VOL、MS COCO、CItyscapes


三、目标检测(Object Detection)

 如果项目的需求是精确的定位出图像中某一物体类别信息和所在位置,则应该选择目标检测算法。基于深度学习的目标检测算法主要分为单阶段(one-stage)两阶段(two-stage) 两种,单阶段算法的速度较快,两阶段算法的精度较高(总体上)。

在这里插入图片描述
(2)常用算法R-CNN(速度慢,过程繁琐,训练所需空间大)、Faster R-CNN(比前者更准确、快速、简便,但还是不够快,不够简洁)和YOLO的目标检测的算法(速度快,泛化能力强,但精度低,小目标和邻近目标检测效果差,比Fast R-CNN定位误差大一些)

(3)常用数据集:PASCAL VOL、MS COCO、ImageNet


四、实例分割(Instance Segmentation)

 相比于语义分割,实例分割不仅需要将图像中所有像素进行分类,还需要区分相同类别中不同个体。比如,语义分割只需要将下图中的所有人的像素进行归类,而实例分割需要将人这一类中单独的个体进行像素分类。

 其实就是目标检测和语义分割的结合。相对目标检测的边界框,实例分割可精确到物体的边缘;相对语义分割,实例分割需要标注出图上同一物体的不同个体

在这里插入图片描述
(2)常用算法:Mask R-CNN、Fast-CNN、DeepMask

(3)常用数据集:PASCAL VOL、MS COCO、CItyscapes


五、全景分割(Panoptic Segmentation)

 全景分割是语义分割和实例分割的结合,即要对所有目标都检测出来,又要区分出同个类别中的不同实例

 实例分割只对图像中的目标进行检测和按像素分割,区分不同实例(使用不同颜色);

 全景分割是对图中的所有物体包括背景(全景)都要进行检测和分割,区分不同实例(使用不同颜色)

在这里插入图片描述
(2)常用算法:Mask R-CNN、DeeperLab、Baseline、UPSNet

(3)常用数据集:Cityscapes、ADE20k、Mapillary Vistas、COCO

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
职计算机平面设计专业人才培养方案 Revised by Jack on December 14,2020 Revised by Jack on December 14,2020 职计算机平面设计专业人才培养方案全文共21页,当前为第1页。职计算机平面设计专业人才培养方案 职计算机平面设计专业人才培养方案全文共21页,当前为第1页。 一、专业名称(专业代码) 计算机平面设计:090300 二、入学要求 初毕业生或具有同等学力者。 三、基本学制 3年。 四、培养目标 本专业主要面向平面广告制作及文化类小企业及各大型影楼、小装饰装潢公司及普通企事业单位,培养从事平面设计与制作、数码照片处理、室内设计制图等工作的高素质劳动者和等技能型人才。 五、职业范围 序号 对应职业(岗位) 职业资格证书举例 专业(技能)方向 1 平面广告设计与制作 计算机操作员(级) 图形图像处理(级) 技能方向:平面设计制作 2 数码照片处理 图形图像处理(级) 技能方向:数码照片处理 3 室内设计制图 制图员(级) 技能方向:室内设计制图 六、人才规格 本专业毕业生应具有以下职业素养、专业知识和技能: (一)职业素养 职计算机平面设计专业人才培养方案全文共21页,当前为第2页。1.学习意识 职计算机平面设计专业人才培养方案全文共21页,当前为第2页。 对专业领域充满浓厚的兴趣,主动钻研,能够经常与同行同事、行业优秀设计师沟通、学习;能够通过网络、图书及时更新自己的专业理念、扩充视野,关注并学习新的技术与方法。 2.职业道德 守秩序,能够自觉遵守企业的规章制度,遵守相关法律法规;道德健康,未经允许不拷贝公司和客户的资料;心灵健康,能保守客户和公司设计开发的相关秘密。 3.合作意识 和谐互助,具有积极协助同事完成设计任务的意识;积极向上,能够按照承诺完成和完善自己的设计制作任务;能够配合设计师确定自己的设计方向完成设计和制作任务。 4.质量意识 能够将顾客的利益放在首位;能够及时准确提供设计小样或效果图;能够根据客户和主管的要求进行设计修改;具有对设计或制作效果负责的意识。 5.服务意识 有修养,能与客户和主管及时沟通设计要求和设计进展状况;自主学习,能及时收集相关信息,分析设计起到的作用;能及时为客户提供技术支持;能按时完成向单位或客户承诺的任务。 (二)专业知识和技能 1.具有本专业所必需的文化基础知识。 职计算机平面设计专业人才培养方案全文共21页,当前为第3页。2.掌握计算机基础知识。 职计算机平面设计专业人才培养方案全文共21页,当前为第3页。 3.掌握应用素描、色彩设计、平面构成的基础美术知识。 4.掌握图形与图像基础知识、动画制作基础知识、数码照片基础知识、建筑制图基础知识及印刷基础知识; 5.能熟练使用Photoshop、CorelDraw等工具软件。 6.能通过含义明确的视觉符号,运用特定明确的图形、图像来表示和代表某事物,运用计算机软件功能,把一定的理念、功能、内容、主要特性等要素准确传达。 7.会进行信息的分析设计、加工整理。 本专业分为四个技能方向: 专业(技能)方向1——平面设计与制作 1.掌握素描、色彩、图形创意、版式设计基础知识。 2.掌握计算机基础知识及操作、计算机彩色模式、图形图像文件格式及不同格式的特点和相互间转换的基本知识及点阵图像和矢量图形基本知识。 3.掌握微机及常用图形图像处理设备(如扫描仪、打印机等)的使用。 4.具备色彩运用表现及平面版式设计的能力。 5.掌握位图图像处理软件和矢量绘图软件的操作。 专业(技能)方向2——数码照片处理 1.掌握素描、色彩、图形创意基础知识以及计算机彩色模式、配色原理。 职计算机平面设计专业人才培养方案全文共21页,当前为第4页。2.掌握数码照片的基本知识。 职计算机平面设计专业人才培养方案全文共21页,当前为第4页。 3.掌握基本的版式设计及创造性布局的能力。 4.掌握Photoshop软件的选取及盖章工具、液化工具、调色工具、图层和蒙版工具等的使用,进行照片处理。 5.掌握Photoshop软件快捷键的使用。 专业(技能)方向3——室内设计制图 1.掌握素描、色彩、图形创意、版式设计基础知识。 2.会阅读简单建筑平面图、立面图、剖面图。 3.掌握计算机操作基础知识;会使用AutoCAD软件绘制基本图形,完成复杂图形尺寸、复杂文本等的生成及编辑;绘制室内设计的平面视图、立面图、和大样图。 4.能使用相关辅助设计软件进行基础操作,完成基本的三维空间表现图;能使用相关设备输出图形。 5.具备使用Photoshop软件处理图像的能力。 七、主要接续专业 高职:电脑艺术专业 本科:平面艺术设计专业 八、课程结构 专业课程设置分为公共基础课、专业核心课、
计算机应用基础 计算机应用基础课程组 1 计算机应用基础项目化教程—第5模块全文共51页,当前为第1页。 2023/5/31 计算机应用基础 2 模块五 演示文稿 PowerPoint 2010 项目一 制作旅游线路推介 计算机应用基础项目化教程—第5模块全文共51页,当前为第2页。 2023/5/31 计算机应用基础 3 模块五 演示文稿 PowerPoint 2010 近年来,旅游成为人们休闲的重要方式,旅行社行业竞争日益白热化,因而旅游线路的选择和推广就显得尤为重要。旅游管理专业的张琳暑假在一家旅行社实习,主管给她布置一项任务:制作青岛的旅游线路推介演示文稿,内容有旅行社简介,青岛经典景点介绍,要求图文并茂,富有视觉冲击力,从而吸引旅行者的关注。 项目提出 计算机应用基础项目化教程—第5模块全文共51页,当前为第3页。 2023/5/31 计算机应用基础 4 模块五 演示文稿 PowerPoint 2010 通过旅行社主管的要求可知,本项目主要涉及的工作有演示文稿的创建,插入图片和绘制图形,设置母版等操作,本项目的重点是自选图形的绘制、组合,以及设置填充效果等来丰富图片的表现力。处理结果如图5-1所示。 项目分析 计算机应用基础项目化教程—第5模块全文共51页,当前为第4页。 2023/5/31 计算机应用基础 5 青岛旅游线路推介样文 计算机应用基础项目化教程—第5模块全文共51页,当前为第5页。 2023/5/31 计算机应用基础 6 相关知识点: 1. PowerPoint 2010的工作界面 PowerPoint 2010启动成功后,屏幕上显示的PowerPoint 2010应用程序工作界面如图所示。 PowerPoint 2010工作界面 计算机应用基础项目化教程—第5模块全文共51页,当前为第6页。 选项卡工具栏:包含软件所有功能和设置选项。具体包括"文件"、"开始"、"插入"、"设计"、"切换"、"动画"、"幻灯片放映"、"审阅"、"视图"。 功能区:对应选项卡工具栏上的选项卡进行归类。功能区的操作图标或按钮会随着所选择的选项卡的不同而不同。 开始:与上一版本的常用工具栏相一致,显示的是剪贴板、幻灯片、字体、段落、绘图和编辑功能的操作图标与按钮。 2023/5/31 7 计算机应用基础 计算机应用基础项目化教程—第5模块全文共51页,当前为第7页。 插入:对应的功能区显示的是在演示文稿可以插入的元素,如文本框、图片、艺术字、剪贴画、特殊字符、对象、音频和视频等。 设计:对应的功能区主要放置了有关演示文稿的主题和背景的设置项。 切换:对应的功能区主要设置每张幻灯片切换方式的参数。 动画:对应的功能区显示的是用户进行自定义动画的所要执行的操作和功能。 幻灯片放映:对应的功能区显示是用户进行幻灯片放映操作所要设置的选项和功能。 2023/5/31 8 计算机应用基础 计算机应用基础项目化教程—第5模块全文共51页,当前为第8页。 另外,"预览视图区"包括幻灯片和大纲预览视图,这方便用户进行幻灯片的管理和编辑;"幻灯片编辑区"是一个舞台,在这里对指定的幻灯片进行添加元素、输入对象,编辑文本等操作;"备注区"一般是用来对幻灯片的内容进行必要的补充说明,但不会显示在放映屏幕上;"状态栏"是用来显示当前光标所在的位置信息和文稿信息;"视图显示设置栏"用于快速切换PPT显示的视图,还可以调整编辑区的显示大小。 2023/5/31 9 计算机应用基础 计算机应用基础项目化教程—第5模块全文共51页,当前为第9页。 2. PowerPoint 2010 的视图 PowerPoint 2010为用户提供了4种视图方式:普通视图、幻灯片浏览视图、阅读视图和备注页视图。在不同的视图下,用户可以观看到不同的幻灯片效果,每个视图有它的作用。各视图进入的命令都可以在视图选项卡窗格找到,如图所示。 2023/5/31 10 计算机应用基础 视图"选项卡窗格 计算机应用基础项目化教程—第5模块全文共51页,当前为第10页。 普通视图:PowerPoint 2010启动后,进入的默认视图就是普通视图,如图5-2所示,在普通视图,用户可以看到预览视图区、幻灯片编辑区和备注区,预览视图区包括了幻灯片窗格和大纲窗格。用户可以分别编辑这些区的内容。 幻灯片浏览视图:幻灯片浏览视图可以让用户查看演示文稿的所有幻灯片,让用户能够快速定位到所要查看的幻灯片。 备注页视图:在备注页视图,用户可以编辑备注窗格的内容。在这一备注页视图编辑备注有别于普通视图的备注窗格的编辑,在此视图,用户能够为备注页添加图片内容。 阅读视图:在幻灯片阅读视图下,演示文稿的幻灯片内容将以全屏的形式显示出来,如果用户设置了动画效果和幻灯片切换等,此视图会将全部效果

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

travellerss

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值