麻省理工公开课人工智能笔记八

本篇讲的是物体识别的相关知识

首先是大卫-马尔的想法,来自摄像头识别的物体,首先进行轮廓描述,然后使用向量表示方向,第三阶段使用方向的简单图形表示,如下图是一个圆柱的三种表示阶段

第二阶段可以认为是一个2.5围的图形,第三阶段表示为一个圆形在竖直方向,这个阶段可以和数据库中对比,一次确定形状。

方法很好,但是没人能实现。

之后是马尔的徒弟Shimon Ullman提出的对比理论:该理论认为,知道一个物体的互相线性无关的任意三个视图就能重新构建出该物体的任何视图。

任意未知对应结点都可以用已知结点表示,有三个已知结点,则表示为Xu = αXa + βXb + γXc + Π,当我们检验所有未知节点都能和已知结点按照相同的、β、γ、 Π匹配时,物体就能判定成功。

这个理论在某些方面有很好的适用性,但在现实物体,如人脸识别中还有较大不足。

之后Shimon Ullman又提出了更依赖于相关性的理论

如下面这几个南瓜脸

如果我们将脸作为整体进行相关性检验,那么没有相同的,而如果我们只关注部分,则可以找到相同的眼睛鼻子组合或者时嘴巴鼻子组合。那么如果我有一个存储了十个眼睛十个鼻子的图片,那我就可以在人群中寻找到相同的。

那什么是相关性,考虑下面这两个简单的图形匹配

如何确定水平位移后的图形与原图是一个,我们可以对某参数X求最大值,里面是对x的积分,积分中是某张脸,f是x的函数,g时x减去平移的函数

如果加入噪音,这并不影响,或者修改为多维,可以修改积分函数,如下图。

以上只能根据相同照片来识图

这是2008年的视频,所以理论还没有大的突破,自2012年以来,人脸识别已经取得了巨大的突破,有兴趣的可以继续了解。

  • 0
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值