![](https://img-blog.csdnimg.cn/20201014180756916.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
论文阅读
文章平均质量分 78
勿分心111222
这个作者很懒,什么都没留下…
展开
-
DETR:End-to-End Object Detection with Transformers
在DETR出现之前,大多数目标检测算法都会生成很多预测框,所以需要加上一个后处理操作,如目标检测中很少有端到端的方法,大部分方法最后至少需要一个后处理的操作,也就是nms(非极大值抑制),不论是proposal based方法还是anchor based方法,最后都会生成很多这个预测框。如何去除这些预测框,就是nms要做的事情。正是因为有了nms,所以这个模型在调参上很复杂,即使训练好了一个模型,部署起来也是十分困难的,nms不是所有硬件都支持的,所以一个简单的端到端的目标检测系统一直是大家梦寐以求的。翻译 2023-01-15 14:29:51 · 232 阅读 · 0 评论 -
名词解释Feature Map、anchor、proposal、groudtruth,
在每个卷积层,数据都是以三维形式存在的。你可以把它看成许多个二维图片叠在一起,其中每一个称为一个feature map。在输入层,如果是灰度图片,那就只有一个feature map;如果是彩色图片,一般就是3个feature map(红绿蓝)。层与层之间会有若干个卷积核(kernel),上一层和每个feature map跟每个卷积核做卷积,都会产生下一层的一个feature map。groudtruth相当于正确打标记的数据。2.anchor和proposal。原创 2023-01-13 15:48:38 · 970 阅读 · 0 评论 -
读Object Relational Graph with Teacher-Recommended Learning for Video Caption
TRL在原有teacher-enforced learning的训练过程的基础上,配合在大型语料库上预训练的语言模型生成的软目标(可以认为是近义词)进行teacher-recommended learning,在每一步的训练中同时学到了数十倍的知识,很好地缓解了由于文本长尾问题所带来的内容相关词汇训练不足的问题。该方法有效地缓解了长尾问题,提高了标题模型的泛化能力。2)描述文本中的词存在长尾问题(long-tailed problem,大多work是普遍存在的),对内容相关的词训练不充分。原创 2023-01-06 22:06:03 · 130 阅读 · 0 评论