关于图像检索方面的一些怪想法

2 篇文章 0 订阅
2 篇文章 0 订阅
       最近看了不少的论文,各种算法,SIFT,SURF,SUSAN。。。。。等等,但是在解决仿射不变性,尺度不变性,遮挡等方面总不是特别的完美,于是我就特别的好奇,为什么人可以轻松的对这些进行识别,而计算机就是不行。于是就想到一个故事,达芬奇画鸡蛋,计算机看到的鸡蛋,就和达芬奇画出来的鸡蛋是一样的,不同的视角鸡蛋总是不同的,你要想让计算机认识鸡蛋,即使就是一个鸡蛋,那也有各种角度,不同距离形成的视觉大小变化,还不说鸡蛋就更是每个都不相同,但是这么多鸡蛋,人只要认识一个就能认识所有,这是为什么。既然计算机不可能认识所有 鸡蛋,那就用机器学习吧,慢慢的教,但是看了论文,好像效果也不是很好。人看到的东西都是3D的,包括人的存储,所以当人存储了鸡蛋或者车的模型后,就可以轻松的认识每一个车和鸡蛋了,即使叫不是车的名字,但是还是知道,这是一个车。所以我觉得问题的根源是不是在于人能识别i因为人看到的是3D的,所以很容易在3D的环境中进行匹配识别,而计算机看到的是2D的,想要2D的在3D中进行识别,就会困难一些。所以如果计算机采用双摄像头进行3D图像采样,然后在识别会不会效果会好很多,如果在视频中进行检索,能不能计算机看到一个车的图形后,构建一个车的3D模型,反正车的样子都差不多,然后用这个3D的模型去检索。只是一个想法,不知道对不对,先记录下来,有空测试测试
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值