人眼视觉仿生算法——全域对象化分割模型(GOSM)优于深度学习,专为人形机器人而生

本文介绍了基于仿生视觉的算法,无需长时间训练,能在短时间内高效识别和分割工业图像中的对象,如层料和框料。算法特点包括即学即用、特征提取高效和复杂个体识别。并与MetaSAM进行对比,展示在3D目标定位和生产应用中的优势。
摘要由CSDN通过智能技术生成

一、算法思想的产生

做视觉的时候,行外人总有种错觉,经常说:这个应该不难吧,看得这么清楚。其实不然,用传统方法来处理图像或点云,到最终获取目标对象的过程,的确不容易,根本没法与人眼进行比较。就算最先进的AI算法,也要训练几天,不用训练的,也要买上百颗GPU吧!

二、实测效果

1.层料识别

一层缸盖工件

全域RGB分割出的对象,包含缸盖圆盘特征对象

可立即提取出的单个缸盖圆盘特征点云对象​​​​​​

2.框料识别

一盒屏蔽环

全域深度分割出的点云对象,包含屏蔽环圆孔特征点云对象

可立即提取出的单个屏蔽环圆孔特征点云对象

3.支持多模型

        理论可以支持无限模型扩展,仅受限于存储空间。

实时切换不同产品型号模型

三、算法特点

1.即学即用

训练过程不是持续的,不需要像深度学习一次持续数天或数周的训练,初始创建一个有一定通用度的模型就可以开始识别工作了,如有识别不到的,会提示增加新的模型,以此循序渐近,可以囊括下有助识别此目标的所有模型。当然,如果能一次完成目标完整3D模型建立,则可以通过3D模型投影生成各类情况下的模型,不用再人工干预。

2.特征提取高效

一张5MP的工业相机2D图及3D点云,普通笔记本电脑,全域对象化的时间不超过100ms,3D点去可以一次完成点云对象提取,2D分割后会再花几ms完成对应对象的云点提取。不会像深度学习类算法,训练一次至少数天。

3.特征组合实现复杂个体识别

复杂个体一般由多个图像对象组成,多个目标击中就可以确定一个复杂组合体,比如人脸,在图像构图上有:头发、眉毛、眼白、瞳孔、角膜、鼻孔、鼻沟、嘴唇、耳廓加皮肤,都匹配上,且连成一片则面部被识别。

四、与Meta SAM(Segment Anything Model)效果对比

Prompt一键抠图!Meta发布史上首个图像分割基础模型,开创CV新范式

Meta最新开源!跟踪一切升级版!性能超越OmniMotion!

首先,仿生算法不需要训练,SAM也声称不需要训练,那行,这一项大家平手;

接着,仿生算法不需要买GPU,SAM要买上百个GPU,这个在上述文章末尾特别说明了,没什么好辩解的,仿生算法完胜~

再看,最关键的分割效果……

分割过程是不需要交互的,就像还没有学会人类语言前的婴儿,基于最本能的图像分割方式。

五、算法扩展

1.有序轮廓

算法本身自发形成一个有意思的现象,对象点序是由外至内螺旋渐进的,也就是说,对象轮廓天然存在于点序的开始一段的连续数据,很容易就提取出来用于计算。

2.形状识别

有了连续的轮廓数据(而非分散的角点数据,或乱序的轮廓数据),对形状描述就成了可达目标。……,这样外形就可以被编码,做为识别依据了。

3.被动双目算法(基于对象匹配)

有了对象提取,被动双目的匹配就可以摆脱使用辩识度低的纹理匹配了,其于对象匹配的被动双目3D成像将十分稳定,达到工业化应用的要求。有望更近一步接近人眼视觉的高适应性,距离适应广,黑色物体、透明物体都可以形成有效点云。

六、生产应用

1.缸盖定位

层料缸盖定位效果

缸盖产品建模

2.电磁屏蔽环定位

框料电磁屏蔽环定位效果

电磁屏蔽环建模

七、分享交流

基于此人眼视觉仿生算法的通用3D目标定位软件分享如下:

Litemaze(A Universal 3D Object Localization Software Based on Human Vision Biomimetic Algorithm)

链接:https://pan.baidu.com/s/1CSswRsDQj0_kqGLZDgm21g?pwd=fyas

提取码:fyas

(可免费领取一个月的试用)

欢迎前来交流,公众号:光沦科技,litemaze

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值