Computer vision: models, learning and inference 学习笔记1:引言

目的

学习《computer vision:models, learning and inferene》并留下笔记。学习笔记将记录和讨论每章节的核心内容,方便未来自己查阅和复习,也可作为同学们的辅助目录。
目前的重点在记录,未来可能会在通读后的基础上,附上自己对难理解细节的讲解。
让我们开始吧。
-2019年3月29日

model,learning and inference 的含义

在引言中,为了介绍本书较为特殊的知识结构体系,作者首先强调了“模型”和“算法”的区别:
模型(model):一系列的、关于世界状态(world state)测量(mearesurement)概率联系
参数(parameter):模型的分类依据。即不同的模型的参数结构是不一样的。
在学习中(learning),我们确定参数,使参数能正确反映模型想要表示的概率联系。
在推测中(inference),我们使用新的测量,使用模型来推测世界状态。
算法(algorithm):学习和推测的方法。

独特之处:基于模型的知识结构体系

接着作者强调了这本书的不同之处:基于模型的知识体系结构。
在其他教材中,作者分章节讨论物体识别、立体视觉等没有联系的技术,对初学者不友好。
而作者认为计算机视觉问题(目标)的本质在于:使用测量(measurement)来推测世界的状态(world state)。
I believe that computer vision should be understood in these terms: the goal, the measurements, the world state, the model, the parameters, and the learning and inference algorithms.
总结来说,这本书将侧重于基于概率的方法来解决问题。因此最初的几章都在讨论概率方法。作者的调侃有意地强调了概率论的重要性:这本书不知道是基于概率方法的计算机视觉,还是包含计算机视觉的概率论丛书。

最关键的是:模型(model)

为什么呢?作者给出了三个原因:

  1. 模型具有泛化性
    First, the model type often transcends the application (the same model can be used for diverse vision tasks).

  2. 模型分类清晰,可以相互独立地理解、学习
    Second, the models naturally organize themselves neatly into distinct families(e.g., regression, Markov random fields, camera models) that can be understood in relative isolation.

  3. 基于模型讨论视觉问题,可以让我们看清算法和应用的内在联系
    Finally, discussing vision on the level of models allows us to draw connections between algorithms and applications that initially appear unrelated. Accordingly, this book is organized so that each main chapter considers a different family of models.

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值