RPC笔记

最新推荐文章于 2023-05-29 15:50:54 发布

dp不会就不会

最新推荐文章于 2023-05-29 15:50:54 发布

阅读量408

点赞数

分类专栏：人工智能 Domain translation 文章标签：人工智能计算机视觉深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_43628058/article/details/129845153

版权

人工智能同时被 2 个专栏收录

11 篇文章 0 订阅

订阅专栏

Domain translation

1 篇文章 0 订阅

订阅专栏

提出了一个相比之前更大的自动贩卖场景最大的模型

包含200个类别，17个超类，83739张图片，包括53739张单物品实例图和30000张超市结算图
在这里插入图片描述对于识别的场景也分为三个难度

每一个图片的分辨率为25921944
对于每个类别，一共有160个视觉的图片
360/94 = 160（4是top virew，45view 30view horizontal view）

评价指标：
在这里插入图片描述表示为第I张图片的，第K个类别的数量和真实的标注的差值
表示为第I张图片所有的类别和真实标注的差值

在这里插入图片描述
其中，分子是一个二值，如果这张图片的所有类别都正确识别，且数量正确，才是1，否则为0
对于N张图片，其平均数量错误的衡量
了以上四个指标，论文中还引用了 [mAP50] 和 [mmAP] 两个指标来客观验证检测效果的好坏。

baseline

在这里插入图片描述
主要分为3个任务
检测器采用 FPN

分割

在这里插入图片描述

1、对于训练集，都是单个图片，将它们都根据标注的信息抠出来，为了区分前景和背景，需要切割出一个比标注信息大一倍的框，一个根据标注信息切割的框

2、将根据比标注框大一倍的框，假设为 gb ，使用一个叫 Saliency detection 的模型区分前景和背景

3、再将其处理过的gb图和未处理gb图通过 CRF 来抠出真正的mask

4、将mask和标注框的图结合来抠出真正的目标框

合成

在这里插入图片描述将抠出来的目标图置于白色背景中，随机
的放置，放置的商品和位置、角度都是随机，且放置的目标遮挡率不能大于0.5

渲染

合成的图片是不符合现实场景的，有光线、阴影的缺少，这里采用Cycle Gan 来对合成图进行渲染，生成比较真实的摆放图

检测

在文章中，训练的图像，是做了消融实验的，训练检测器的时候，对4个场景的数据进行了分别的训练对比

在这里插入图片描述
文章中认为，因为训练集的场景和真实的结账场景是有差异的，而如果是对每一个类别都穷举训练，是非常困难的，为了减少差异，严格使用单个目标的图像来训练，通过切割、合成和渲染，逐步把任务完成，且文章中也提到了在零售场景，目标物体的更新太快，因此作者也提出了可以使用Online learning 或者说增量学习来缓解，但是它认为这个方法也会带来别的问题。

dp不会就不会

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
RPC笔记

包含200个类别，17个超类，83739张图片，包括53739张单物品实例图和30000张超市结算图对于识别的场景也分为三个难度每一个图片的分辨率为25921944对于每个类别，一共有160个视觉的图片360/94 = 160（4是top virew，45view 30view horizontal view）评价指标：表示为第I张图片的，第K个类别的数量和真实的标注的差值表示为第I张图片所有的类别和真实标注的差值。
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。