cs131 第一讲 课程介绍
by:斯坦福大学计算机科学系
github: https://github.com/zhaoxiongjun/CS131_notes_zh-CN (包含中英文版课件及相关课程视频)
1 什么是计算机视觉?
1.1 定义
计算机视觉有两种定义:计算机视觉可以定义为从数字图像中提取信息的科学领域。从图像获得的信息类型可以是多样的,从识别,空间测量导航或增强现实应用。
定义计算机视觉的另一种方法是通过其应用程序。计算机视觉正在构建可以理解图像内容并将其用于其他应用程序的算法。我们将在第四节中更详细的了解到计算机视觉应用的不同领域。
一点历史:计算机视觉的起源可以追溯到1966年麻省理工学院的本科暑期项目[ 4]。当时人们认为计算机视觉可以在一个夏天解决,但我们现在有一个50年历史的科学领域还远未解决。 图1:多个科学领域交叉的计算机视觉
1.2 跨学科领域
计算机视觉汇集了大量学科。神经科学首先可以通过理解人类视觉帮助计算机视觉,我们将在第2节中看到。计算机视觉可以被视为计算机科学的一部分,算法理论或机器学习对于开发计算机视觉算法至关重要。我们将在本课程中展示图中1的所有字段是如何连接,计算机视觉如何从中获得灵感和技巧。
1.3 一个难题
计算机视觉在50年内尚未解决,仍然是一个非常棘手的问题。这是我们人类无意识的行为,但这对计算机来说确实很难。
- 诗歌比国际象棋更难
在1997年,IBM的超级计算机Deep Blue首次击败世界国际象棋冠军加里卡斯帕罗夫。今天我们仍然很难构造一个算法输出的句子很好,更不用说诗歌了。这两个领域之间的差距表明什么是人类智能通常不是评估计算机任务难度的良好标准。深蓝通过数百万种可能性中的蛮力搜索赢得了胜利,而不是比卡斯帕罗夫更聪明。 - 视觉比3D建模更难