麻省理工公开课人工智能笔记八

最新推荐文章于 2020-01-29 12:10:34 发布

wuwei178

最新推荐文章于 2020-01-29 12:10:34 发布

阅读量377

点赞数

分类专栏：课堂笔记人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/wuwei178/article/details/103903103

版权

课堂笔记同时被 2 个专栏收录

14 篇文章 5 订阅

订阅专栏

14 篇文章 5 订阅

订阅专栏

本篇讲的是物体识别的相关知识

首先是大卫-马尔的想法，来自摄像头识别的物体，首先进行轮廓描述，然后使用向量表示方向，第三阶段使用方向的简单图形表示，如下图是一个圆柱的三种表示阶段

第二阶段可以认为是一个2.5围的图形，第三阶段表示为一个圆形在竖直方向，这个阶段可以和数据库中对比，一次确定形状。

方法很好，但是没人能实现。

之后是马尔的徒弟Shimon Ullman提出的对比理论：该理论认为，知道一个物体的互相线性无关的任意三个视图就能重新构建出该物体的任何视图。

任意未知对应结点都可以用已知结点表示，有三个已知结点，则表示为Xu = αXa + βXb + γXc + Π，当我们检验所有未知节点都能和已知结点按照相同的、β、γ、 Π匹配时，物体就能判定成功。

这个理论在某些方面有很好的适用性，但在现实物体，如人脸识别中还有较大不足。

之后Shimon Ullman又提出了更依赖于相关性的理论

如下面这几个南瓜脸

如果我们将脸作为整体进行相关性检验，那么没有相同的，而如果我们只关注部分，则可以找到相同的眼睛鼻子组合或者时嘴巴鼻子组合。那么如果我有一个存储了十个眼睛十个鼻子的图片，那我就可以在人群中寻找到相同的。

那什么是相关性，考虑下面这两个简单的图形匹配

如何确定水平位移后的图形与原图是一个，我们可以对某参数X求最大值，里面是对x的积分，积分中是某张脸，f是x的函数，g时x减去平移的函数

如果加入噪音，这并不影响，或者修改为多维，可以修改积分函数，如下图。

以上只能根据相同照片来识图

这是2008年的视频，所以理论还没有大的突破，自2012年以来，人脸识别已经取得了巨大的突破，有兴趣的可以继续了解。

关注

0
点赞
踩
5

收藏

觉得还不错? 一键收藏
0
评论
麻省理工公开课人工智能笔记八

本篇讲的是物体识别的相关知识首先是大卫-马尔的想法，来自摄像头识别的物体，首先进行轮廓描述，然后使用向量表示方向，第三阶段使用方向的简单图形表示，如下图是一个圆柱的三种表示阶段第二阶段可以认为是一个2.5围的图形，第三阶段表示为一个圆形在竖直方向，这个阶段可以和数据库中对比，一次确定形状。方法很好，但是没人能实现。之后是马尔的徒弟Shimon Ullman提出的对比理论：该理论...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。