第一章:计算机视觉梗概
第二章:图像分类途径
python+Numpy简单教程:
http://cs231n.github.io/python-numpy-tutorial/
Image Classification: A core task in Computer Vision(核心任务)
————计算机可以识别图像里面的内容。
The Problem: Semantic Gap(计算机眼里的图片是一系列像素的数值,如何解决语义隔阂?)
Challenges: Viewpoint variation(视觉变化,计算机看到的图像又是不同的,十分复杂)
- Challenges: Illumination(光线?)
Challenges: Deformation(视觉中物体的姿态?)
Challenges: Occlusion(产生遮挡?)
Challenges: Background Clutter(视觉中的物体和背景非常相似时又该如何识别???)
Challenges: Intraclass variation(物种问题??物体多物种)
An image classifier(分类器):是一个函数,参数是一张image输出是图片的label
下面是关于分类器的一些尝试:
1.寻找图片里面元素的边界,因为一个边界往往是像素值相同,所以可以描绘出边界勾勒出物体的轮廓,寻找一些角。
2.数据驱动的方式
收集一些有标签图片作为数据集——>用这个数据集来训练分类器(机器学习的办法)——>评估这个分类器(新的图像