机器视觉基础笔记(L1&2)
Lecture1
- 机器视觉/cv,是一门交叉学科,涉及到了生物学,认知心理学,计算机科学,数学,工程学和物理学等。
- 什么是机器视觉?通过建立image和意义之间的桥梁。
- 我们发现人的视觉能力非常强,能够快速找到图片中的人,150ms就可以快速分开动物/非动物。
- 并且我们的视觉能力有一些长期进化形成的特点,例如“一起来找茬”的困难,因为我们视觉一般都是通过整体来感知,而忽略其中的一些细节。
- 以及我们对图像的常识会让我们认为同一个图片不可能出现两个同样的人。
- 会受到场景的影响来判断颜色的深浅/会讲静止的物体看成运动。动/没动
- 从图像中我们可以得到两种信息:1. 3D尺寸信息 2.语义信息
- 测量:应用场景非常丰富,包括无人驾驶,3D重构,
- 语义:场景中出现的事物,天空,摩天轮,人等。
- 为什么