dert论文笔记(二)

在这里插入图片描述把这个编码器的自注意给可视化出来。我们在每个牛身上找一个基准点,然后我们用这个点和图像上其他点算自注意力,我们会发现他已经做的很好了。已经接近实力分割里面的mask的形状。我们在这个基础上去做decoder 或者目标检测 或者实力分割 任务 都会简单很多。
在这里插入图片描述decoder中也自注意力机制,我们把每个物体自注意力用用不同颜色表现出来。
encorder学的是全局特征,能基本把物体分开,但是这还不够 decoder就是把边缘这些头 尾巴这些给区分开
在这里插入图片描述
object query的可视化。在coco验证集里面得到的输出框可视化出来。n=100 这里只是20个object query。绿色的代表小的bbx 红色代表大的横向的bbxc蓝色代表竖向的大的bbx.其实object query 就是像问问题的人一样。

##总结
他是一个全新的做目标检测的框架,主要利用了transforms和二分图匹配,实现了端到端学习的网络,在coco上和fast rcnn打成平手。在全景分割上取得了更好的结果。因为他的简单应用性 他有很大的潜力应用到别的任务上。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值