文章目录
前言
计算机视觉(Computer Vision,CV)是一门研究如何让机器具备“看”的能力的学科,以人或动物的视觉能力为参照,通过计算机对视觉数据(图像、视频等)的处理、学习、推理判断,复现出、模拟出甚至超过人或动物的某些视觉功能,赋予机器对客观世界的观察、发现、理解能力,进而提高机器的工作能力!!!
计算机视觉涵盖的内容丰富,需要完成的任务也非常多,但其中最基本的任务包含四项:分类、定位、检测和分割;可以说其他关键任务都是在四项基本任务的基础上延伸开来的。
下图是一副经典的示意图。
分类-Classification:解决“是什么?”的问题,即给定一张图片或一段视频判断里面包含什么类别的目标。对于一幅图像来说,分类就是聚类;对于一组图像样本来说,分类是检测出样本中有相同目标的图像。
如下图所示,将给出的图像分类到CAT这一类。
常用数据集
以下是几种常用分类数据集 。
- MNIST&#x