概论
1、计算机视觉的难点与人工神经网络
- 计算机识别有着严格的限制和规格,同一张图片或者场景,一旦光线甚至于观察角度发生变化,计算机的判别也会发生变化。
- 对于计算机来说,识别两个独立的物体容易,但在不同场景下识别同样一个物体则困难的多。
- 计算机视觉核心在于如何忽略同一个物体内部的差异而强化不同物体之间的区别
- CNN带有卷积结构的神经网络应用于机器视觉中,具有通用性强、迁移能力强、工程开发优化维护成本低的特点。
2、计算机视觉学习的基础
计算机视觉是个交叉学科,包括人工智能、数字图像处理、机器学习、深度学习、模式识别、概率图模型、科学计算,以及一系列的数学计算等。
平台和模型是重中之重
- 目前常用的平台有TensorFlow、Caffe、PyTroch等
- 应用较为广泛的模型有AlexNet、VGGNet、ResNet等
除此之外,速度和周期也是需要考虑的非常重要的因素。
所有的模型设计和应用最核心的部分就是任务处理的对象,主要包括检测、识别、分割、特征点定位、序列学习五个大的任务。
3、计算机视觉的学习方式
学习方式有监督学习、半监督学习和无监督学习。将带有标注的图片送到神经网络模型中去学习成为监督学习,在监督学习的计算机机器视觉领域,深度学习取得了重大成果,但在半监督学习和无监督学习的学习领域还有更多更大的呢哦荣急待解决。