计算机视觉
计算机视觉是什么
计算机视觉是一门让计算机学会“看”的学科,研究如何自动理解图像和视频中的内容。
计算机视觉的发展
- 早期萌芽(1960~1980);
- 统计机器学习与模式识别(1990~2000),如Eigen Face、Haar小波特征、Adaboost级联分类器、LBP、SIFT、HOG等;
- ImageNet大型数据库(2006~2010),在此期间出现了Deformable Part Model for object detection;
- 深度学习的时代(2012~),一大批具有优异性能的网络开始出现,如AlexNet、ResNet等,并且深度学习的应用范围也在不断拓展,如目标检测、实力分割、图像生成等。
OpenMM
OpenMM的现状
- 提供先进的底层架构;
- 覆盖计算机视觉众多方向;
- 提供最经典、最前沿的算法支持;
- 提供统一的基准和开箱即用的工作。
机器学习和神经网络
机器学习
让计算机从数据中学习去解决问题。
机器学习的典型范式
- 监督学习。数据之间存在某种映射关系,如何基于有限的数据样本推断出这种关系?
- 无监督学习。数据自身是否存在某种“结构”或“规律”?
- 强化学习。如何与环境交互,以获得最大的收益?
神经网络
一种拟合能力非常强的函数,可以通过两层感知机方便地拟合异或函数。