周报2022-9-28

本周的技术周报涵盖了人工智能领域,特别是深度学习和计算机视觉的热点。讨论了ViT的局限性,数据泄露问题,分割方法,如Bytetrack和RoIAlign的改进。此外,介绍了视频建模技术,如Non-local Net和Content-aware RCNN,以及时序动作提名生成方法BSN、BMN和BSN++。重点解析了BMN中的Proposal Evaluation Model(PEM)及其工作原理。
摘要由CSDN通过智能技术生成

一、vit缺少inductive bias

在这里插入图片描述

二、数据泄露

数据泄露这个概念在kaggle算法竞赛中经常被提到,这个不同于我们通常说的生活中隐私数据暴露,而是在竞赛中经常出现某支队伍靠着对极个别feature的充分利用,立即将对手超越,成功霸占冠军位置,而且与第二名的差距远超第二名与第十名的差距,那么很有可能是出现了数据泄露(Data Leakage)。这些feature却不是在因果关系上顺利解释预测值的‘因’,反而是预测值的‘果’。

三、分割领域的两种分割方法

Per-pixel classification formulation
请添加图片描述
Mask classification formulation
请添加图片描述
请添加图片描述
MaskFormer:
请添加图片描述

四、Bytetrack

在这里插入图片描述

五、RoIAlign采用双线性插值,比RoIPooling更精确

在这里插入图片描述
在Mask R-CNN中的RoI Align之后有一个"head"部分,主要作用是将RoI Align的输出维度扩大,这样在预测Mask时会更加精确。在Mask Branch的训练环节,作者没有

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值