人眼视觉仿生算法——全域对象化分割模型（GOSM）优于深度学习，专为人形机器人而生

猫王子仁

已于 2023-09-17 02:25:19 修改

阅读量758

点赞数 1

文章标签：算法深度学习人工智能

于 2023-08-17 18:15:12 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/wgywilliamwzh/article/details/132346789

版权

本文介绍了基于仿生视觉的算法，无需长时间训练，能在短时间内高效识别和分割工业图像中的对象，如层料和框料。算法特点包括即学即用、特征提取高效和复杂个体识别。并与MetaSAM进行对比，展示在3D目标定位和生产应用中的优势。

摘要由CSDN通过智能技术生成

一、算法思想的产生

做视觉的时候，行外人总有种错觉，经常说：这个应该不难吧，看得这么清楚。其实不然，用传统方法来处理图像或点云，到最终获取目标对象的过程，的确不容易，根本没法与人眼进行比较。就算最先进的AI算法，也要训练几天，不用训练的，也要买上百颗GPU吧！

二、实测效果

1.层料识别

一层缸盖工件

全域RGB分割出的对象，包含缸盖圆盘特征对象

可立即提取出的单个缸盖圆盘特征点云对象

2.框料识别

一盒屏蔽环

全域深度分割出的点云对象，包含屏蔽环圆孔特征点云对象

可立即提取出的单个屏蔽环圆孔特征点云对象

3.支持多模型

理论可以支持无限模型扩展，仅受限于存储空间。

实时切换不同产品型号模型

三、算法特点

1.即学即用

训练过程不是持续的，不需要像深度学习一次持续数天或数周的训练，初始创建一个有一定通用度的模型就可以开始识别工作了，如有识别不到的，会提示增加新的模型，以此循序渐近，可以囊括下有助识别此目标的所有模型。当然，如果能一次完成目标完整3D模型建立，则可以通过3D模型投影生成各类情况下的模型，不用再人工干预。

2.特征提取高效

一张5MP的工业相机2D图及3D点云，普通笔记本电脑，全域对象化的时间不超过100ms，3D点去可以一次完成点云对象提取，2D分割后会再花几ms完成对应对象的云点提取。不会像深度学习类算法，训练一次至少数天。

3.特征组合实现复杂个体识别

复杂个体一般由多个图像对象组成，多个目标击中就可以确定一个复杂组合体，比如人脸，在图像构图上有：头发、眉毛、眼白、瞳孔、角膜、鼻孔、鼻沟、嘴唇、耳廓加皮肤，都匹配上，且连成一片则面部被识别。

四、与Meta SAM（Segment Anything Model）效果对比

Prompt一键抠图！Meta发布史上首个图像分割基础模型，开创CV新范式

Meta最新开源！跟踪一切升级版！性能超越OmniMotion！

首先，仿生算法不需要训练，SAM也声称不需要训练，那行，这一项大家平手；

接着，仿生算法不需要买GPU，SAM要买上百个GPU，这个在上述文章末尾特别说明了，没什么好辩解的，仿生算法完胜~

再看，最关键的分割效果……

分割过程是不需要交互的，就像还没有学会人类语言前的婴儿，基于最本能的图像分割方式。

五、算法扩展

1.有序轮廓

算法本身自发形成一个有意思的现象，对象点序是由外至内螺旋渐进的，也就是说，对象轮廓天然存在于点序的开始一段的连续数据，很容易就提取出来用于计算。

2.形状识别

有了连续的轮廓数据（而非分散的角点数据，或乱序的轮廓数据），对形状描述就成了可达目标。……，这样外形就可以被编码，做为识别依据了。

3.被动双目算法（基于对象匹配）

有了对象提取，被动双目的匹配就可以摆脱使用辩识度低的纹理匹配了，其于对象匹配的被动双目3D成像将十分稳定，达到工业化应用的要求。有望更近一步接近人眼视觉的高适应性，距离适应广，黑色物体、透明物体都可以形成有效点云。

六、生产应用

1.缸盖定位

层料缸盖定位效果

缸盖产品建模

2.电磁屏蔽环定位

框料电磁屏蔽环定位效果

电磁屏蔽环建模

七、分享交流

基于此人眼视觉仿生算法的通用3D目标定位软件分享如下：

Litemaze(A Universal 3D Object Localization Software Based on Human Vision Biomimetic Algorithm)

链接：https://pan.baidu.com/s/1CSswRsDQj0_kqGLZDgm21g?pwd=fyas

提取码：fyas

（可免费领取一个月的试用）

欢迎前来交流，公众号：光沦科技，litemaze

关注

1
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

猫王子仁 CSDN认证博客专家 CSDN认证企业博客

码龄16年

1: 原创

97万+: 周排名

157万+: 总排名

757: 访问

: 等级

11: 积分

0: 粉丝

1: 获赞

0: 评论

1: 收藏

私信

关注

热门文章

人眼视觉仿生算法——全域对象化分割模型（GOSM）优于深度学习，专为人形机器人而生 758

最新评论

人眼视觉仿生算法——全域对象化分割模型（GOSM）优于深度学习，专为人形机器人而生
CSDN-Ada助手: 恭喜您开始博客创作！标题中提到的人眼视觉仿生算法——全域对象化分割模型（GOSM）听起来非常引人注目。很高兴看到您对这一领域的研究和探索。我期待着进一步了解您对GOSM的具体介绍和实验结果。同时，我建议您在博客中加入一些与深度学习方法进行比较的分析，以便读者更好地理解GOSM在实际应用中的优势。期待您下一篇博客的发布！推荐【每天值得看】：https://bbs.csdn.net/forums/csdnnews?typeId=21804&utm_source=csdn_ai_ada_blog_reply1

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。