人工智能导论(8)——计算机视觉(Computer Vision)

hustlei

已于 2022-03-08 23:00:54 修改

阅读量1.5w

点赞数 30

分类专栏：人工智能导论文章标签：计算机视觉目标检测图像生成人脸识别人工智能导论

于 2021-12-12 22:12:04 首次发布

本文链接：https://blog.csdn.net/hustlei/article/details/121894213

版权

人工智能导论专栏收录该内容

12 篇文章 291 订阅

订阅专栏

文章目录

一、概述
二、重点内容
三、思维导图
四、重点知识笔记

一、概述

计算机视觉是智能感知的最重要技术。

为方便记忆和回顾，根据个人学习，总结人工智能基础知识和思维导图形成系列。

二、重点内容

计算机视觉简介
主要计算机视觉技术

三、思维导图

人工智能基础知识(8)——计算机视觉

四、重点知识笔记

计算机视觉的主要流程

人的大脑皮层，有差不多70%都是在处理视觉信息，是人类获取信息最主要的渠道。
计算机视觉（Computer Vision，CV）是研究如何让计算机能够像人类那样“看”的技术。

机器视觉是面向应用的计算机视觉系统的设计与实现技术。机器视觉更偏重于产品生产、自动化等行业和工程应用

其基本过程为：

计算机视觉基本流程

主要计算机视觉技术

目前计算机视觉主要应用在人脸识别、图像识别方面（包括静态、动态两类信息）。

图像分类(image classification)
目标定位(object localization)
目标检测(object detection)（多个目标）
目标跟踪(Object Tracking)
图像分割(Image Segmentation)
图像生成(Image Generation)
人脸识别(Face Recognition)

图像分类：解决“是什么？”的问题，即给定一张图片或一段视频判断里面包含什么类别的目标。
目标定位：解决“在哪里？”的问题，即定位出这个目标的的位置。
目标检测：解决“是什么？在哪里？”的问题，即定位出这个目标的的位置并且知道目标物是什么。用方框标记。
目标分割：分为实例的分割（Instance-level）和场景分割（Scene-level），解决“每一个像素属于哪个目标物或场景”的问题。类似于抠图。

机器视觉
图片来自斯坦福 CS224d 课程

图像分类(image classification)

图像分类，核心是从给定的分类集合中给图像分配一个标签的任务。也就是说给定一张输入图像，图像分类可以判断该图像中物体所属类别，即是否有猫，是否有狗。

图像分类根据不同分类标准可以划分为很多种子方向。比如根据类别标签，可以划分为：

二分类问题，比如判断图片中是否包含人脸；
多分类问题，比如鸟类识别；
多标签分类，每个类别都包含多种属性的标签，比如对于服饰分类，可以加上衣服颜色、纹理、袖长等标签。
- 通用分类，比如简单划分为鸟类、车、猫、狗等类别；
- 细粒度分类，目前图像分类比较热门的领域，比如鸟类、花卉、猫狗等类别，它们的一些更精细的类别之间非常相似，而同个类别则可能由于遮挡、角度、光照等原因就不易分辨。

目前较为流行的图像分类架构是卷积神经网络（CNN）——将图像送入网络，然后网络对图像数据进行分类。