计算机视觉基础入门_01_introduction

前言

        因为毕业设计设计到机器视觉部分,所以在寒假的时候看了北邮鲁鹏老师的计算机视觉(本科)的公开课程,观看之后不由大为震撼,即使初次接触也令我如痴如醉,越看越上头。还是比较庆幸本科选择了CS专业,我发现其实自己挺喜欢学计算机,因为它让我看到了可以改变自己生活方式、真正去拥抱生活的希望。我真的再过几年的时间,我可以真的实现我的目标,至于目标是什么,等我真正达到了,再回来划伤句号。



机器视觉系统的目标:

为了跨越"语义鸿沟",使得机器能够提取出图像中的内容


人类视觉特点:

  1. 运动致盲
    在识别图像时为了加快理解物体、快速反应物体,人类可能会只关注主体,而去忽略其他细节,
  2. 能够利用上下文背景信息去理解图像
    如:在初次接触陌生信息时,会用个人常识去先入为主理解自己所接收到的信息
  3. 人类视觉系统有时可能会对图像进行增强加工,有时候我们看到的并不是真的图像表现。
    这也是人类进化的结果,为了让我们能够去更好理解世界;而如果让机器来识别就永远都看不出来不同
  4. 视觉系统会脑补物体运动,及时图像本身是静态的

计算机视觉学科起源

从1966年MIT的人工智能研究组夏令营开始,明斯基教授在做符号推理时遇到了机器识别图像的相关问题,发现无法从现有的知识体系出发解决问题,没有一个指导思想或者一套工具来解决这个问题,问题是什么都没描述不清楚,遇到了什么难点也都描述不清楚,于是从图像处理中分割出来了计算机视觉领域。


计算机视觉传奇人物——大卫·马尔(David Marr)

大卫马尔给出了计算机视觉系统的框架,给其分为三层:

  1. 计算理论(Computational theory)
    计算机视觉的目标、任务是什么,以及在干的过程中到底有哪些约束
  2. 表达和算法(Representations and algorithms)
    如何表示输入、输出以及中间的计算过程如何表示;输入和输出之间的过程如何实现
  3. 硬件实现(Hardware implementation)
    通过硬件来实现算法,从而加速;用硬件的约束来去指导算法简化模型

为了纪念David Marr,为此在计算机视觉领域上计算机视觉国际大会(ICCV)设立了最高奖马尔奖(Marr Price)


图像中包含的信息 => 计算机视觉的主要工作

  1. 3D场景信息. => 从图像中恢复3D结构信息,3D重建
  2. 语义信息. => 从图像中恢复语义信息,用来理解图像是什么



最后第一节课堂上老师的话:
速成只能解决别人已经解决过的问题,把别人思路再复现一次,不能解决新的问题;
更重要是培养专业的思维方法和踏实的知识储备

  • 2
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值