计算机视觉上课笔记（研究生自用）

最新推荐文章于 2023-02-26 21:36:35 发布

努力是一生的工具

最新推荐文章于 2023-02-26 21:36:35 发布

阅读量732

点赞数 1

分类专栏：上课用文章标签：计算机视觉人工智能图像处理

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_46421117/article/details/126977146

版权

上课用专栏收录该内容

1 篇文章 0 订阅

订阅专栏

视觉信息获取（图像获取）
采样、量化、表示
视觉信息处理（图像处理）
图像预处理、滤波、变换、分割、特征表示和检测
视觉信息理解（图像理解）
三维信息恢复和重建、运动信息提取

一.计算机视觉的发展历史

20世纪50年代：统计模式识别

二维图像分析和识别，如光学字符识别、工件表面、显微图片和航空图片的分析和解释等

20世纪60年代：Roberts的三维积木世界

通过计算机程序从数字图像中提取出诸如立方体、楔形体、棱柱体等多面体的三维结构，并对物体形状及物体的空间关系进行描述
开创了以理解三维场景为目的的三维视觉研究
后人解决了由线段解释景物和处理阴影等问题

20世纪70年代：Marr为代表的计算理论
核心是从图像恢复物体的三维形状
提出要从不同层次去研究信息处理的问题
强调计算理论和算法实现
20世纪80年代：主动视觉(Active Vision)
主动视觉的四个特征：主动性(Active) 、选择性(Selective) 目的性(Purposive) 、定性性(Qualitative)
对计算机视觉新的理解：根据任务，调整成像参数，选择感兴趣的区域，获取相关的图像信息

二.Marr视觉理论

1.提出人（背景）

David Marr
(1945-1980)是英国心理学家。他将心理学、人工智能和神经生理学的结果结合起来，对视觉的研究做出了重要贡献。他是计算视觉的奠基人。
David Marr 70年代末在美国MIT提出了第一个较为完善的视觉系统框架，尽管此框架存在很多缺陷，但过去几十年一直处于主导地位。

2.视觉处理的三个阶段

在这里插入图片描述

在这里插入图片描述

3. 内容

马尔计算视觉理论包含二个主要观点：

首先，马尔认为人类视觉的主要功能是复原三维场景的可见几何表面，即三维重建问题；
其次，马尔认为这种从二维图像到三维几何结构的复原过程是可以通过计算完成的，并提出了一套完整的计算理论和方法。

所以，马尔视觉计算理论在一些文献中也被称为三维重建理论。

4.注意错误性

后三十多年的研究中，人们发现马尔理论的基本假设：“人类视觉的主要功能是复原三维场景的可见几何表面”基本上是不正确的，“物体识别中的三维表达的假设”也基本与人类物体识别的神经生理机理不相符。

三.图像采样

略

努力是一生的工具

关注

1
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
计算机视觉上课笔记（研究生自用）

胡老师上课笔记自用
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。