论文阅读练习(3)

Spatial-Temporal Relation Networks for Mulit-Object Tracking(25.Apr.2019)

作者:Jiarui Xu13∗ , Yue Cao23, Zheng Zhang3 , Han Hu3

1Hong Kong University of Science and Technology

2School of Software, Tsinghua University

3Microsoft Research Asia

摘要

多目标跟踪(MOT)最新的进展证明了tracker的成功关键是一个鲁棒的相似度分数。一个好的相似度分数可以反映多个线索,例如一段长时间的外观、位置和拓扑结构。但是,这些线索是异质性的,使得它们很难组合到一个完整的网络中。现存的方法通常在分开的网络中编码这些特征或者用复杂的训练方法进行训练。这篇文章中,对于相似度度量提出一个完整的框架,它可以同时编码不同的线索并通过空域和时域执行合理的操作。此文章还深入研究了tracklet-object对的特征表示,证明了对特征的合理设计可以很好地增强tracker的能力。此文章方法命名为时序相关网络(spatial-temporal relation networks (STRN))。它以前馈方式运行并实现端到端训练。使用公共检测和在线设置,在所有MOT15~17基准上实现了最先进的精度。

问题:针对tracking过程中相似度度量,特征的异质性影响相似度分数

方法:对于不同的特征设计了一个整体框架,对不同特征同时编码,通过空域和时域实现特征聚合(concatenate),再计算相似度分数。

效果:

Making Convolutional Networks Shift-Invariant Again  (ICML2019,25.Apr)

作者:Richard Zhang

摘要

现在的卷积网络不是平移不变的,当输入发生很小的平移或移动会引起输出的很大改变。通常使用下采样方法例如max-pooling、步长卷积和平均pooling,忽略采样定理。著名的信号处理修复是抗混叠——在下采样之前进行低通滤波。但是,在深度网络中简单的插入这个模块导致退化表现。此篇文章证明了当正确集成时,它与现有的体系结构组件(如max pooling)兼容。这个技术是泛化的并可以通过layer type合并,应用例如图像分类,条件图像生成。除了增加移动不变性之外,还意外地观察到,在几个常用的体系结构中,消除混叠提高了ImageNet分类的准确性。这表明消除混叠提供了有效的正则化。研究结果表明,这种经典的信号处理技术在现代深度网络中一直被忽视。

code:https://richzhang. github.io/antialiased-cnns/

混叠(英语:Aliasing),主要来自于对连续时间信号作取样数字化时,取样频率低于两倍奈奎斯特频率。统计信号处理和相关领域中,混叠是指取样信号被还原成连续信号时产生彼此交叠而失真的现象。当混叠发生时,原始信号无法从取样信号还原。而混叠可能发生在时域上,称做时间混叠,或是发生在频域上,被称作空间混叠。

问题:卷积网络中的输入发生很小变化引起输出很大变化

方法:加入传统信号处理技术——抗混叠,在下采样之前经过低通滤波

效果:

 

 

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值