该文章转载自:http://blog.csdn.net/gxf1027/article/details/8650878
完整录用论文官方链接:http://www.pamitc.org/cvpr13/program.php
今年CVPR有open access,真是造福大众啊,特别造福了我这样的科研小菜鸟
今年有关RGB-D摄像机应用和研究的论文渐多起来了。
当然,自己还是比较关心Tracking方面的Papers。从作者来看,一作大部分为华人,而且有不少在Tracking这个圈子里相当有名的牛,比如Ming-Hsuan Yang,Robert Collins,Chunhua Shen等。此外,从录用论文题目初步判断,Sparse representation的热度在减退,所以Haibin Ling老师并没有这方面的文章录用,且纯粹的tracking-by-detection几乎不见踪影了。
以下是摘录的tracking方面的录用论文:
Oral部分:
Structure Preserving Object Tracking. Lu Zhang, Laurens van der Maaten
Tracking Sports Players with Context-Conditioned Motion Models. Jingchen Liu, Peter Carr, Robert Collins, Yanxi Liu
Post部分:
Online Object Tracking: A Benchmark. Yi Wu, Jongwoo Lim,Ming-Hsuan Yang(目标跟踪的测试视频真是越来越脱离实际了,为什么不多从一些实际应用场景中截取呢。此外,还是极其佩服作者的耐心和贡献,他/她<光从名字真不好判断啊>用了两种metric来全面地评价state-of-the-art trackers。其中用到了AUC曲线<记录在不同重叠率或中心定位误差限制下的跟踪sucess ratio>,我觉得这是非常严谨的做法,这大概是首创吧。并且,测试了不同初始化<模拟了检测器输出的位置误差,和在视频不同阶段开始跟踪测试>情况下trackers的表现,这也是之前几乎没人做过的吧。做这种测试还是需要投入大量时间,光是让各种codes在自己的机器上跑起来有时候就会让人很抓狂了,其中的繁琐也只有做过的人才能真正体会吧。剧透一下,最终的结果No.1属于Struck)
Learning Compact Binary Codes for Visual Tracking. Xi Li,Chunhua Shen, Anthony Dick, Anton van den Hengel (延续了作者之前论文的体系,包括用SVM做跟踪和加入图结构来描述样本间的关联等。虽然把Binary Codes放到题目里,但是作者却没有明晰地解释为什么要用二值特征。这让像我这样的初学者不解到底费这么大劲把实值特征转换为二进制串的收益在哪里。)
Part-based Visual Tracking with Online Latent Structural Learning. Rui Yao, Qinfeng Shi,Chunhua Shen, Yanning Zhang, Anton van den Hengel
Self-paced learning for long-term tracking.James Supancic III, Deva Ramanan(long-term的噱头还是很吸引人的,和当年TLD一样,看看是否是工程的思想多一些。读后感觉就是学术味比较重,虽然和TLD一样都是突出了long-term,但是作者使用了增量SVM来训练检测器,并采用从关键帧中学习的思想。对这篇论文的短评请移步BFCAT的博客。我的感觉是2006年-2010是基于Boosting的跟踪的黄金时期,实质就是基于在线特征选择的鉴别型表观。随后,SVM开始兴起,当然之前也有SVM跟踪,可能是由于SVM对小样本高维特征的分类优势。代表论文可以参考:Struck,它在上面那篇Online Object Tracking: A Benchmark的多项测评中获得第一,且提供了源码(C++风格,简洁,非常好)!)
Visual Tracking via Locality Sensitive Histograms.Shengfeng He, Qingxiong Yang, Rynson Lau, Jiang Wang, Ming-Hsuan Yang (CityU of HK,使用直方图作为表观在当前研究背景下真是反其道而行之啊)
Minimum Uncertainty Gap for Robust Visual Tracking.Junseok Kwon, Kyoung Mu Lee (VTD作者,浏览了一下论文,满屏的公式推导啊,没有看下去的动力了)
Least Soft-thresold Squares Tracking. Dong Wang,Huchuan Lu,Ming-Hsuan Yang(本来对这篇很有期望的,但是看完之后感情受欺骗......和作者的Online Object Tracking with Sparse Prototypes从目标函数和优化方法来看几乎是一模一样的,只是叙述的角度不同。不言明了)
Tracking People and Their Objects. Tobias Baumgartner,Dennis Mitzel, Bastian Leibe(这个应该也有应用的背景和前景)
(以上不全包括多目标跟踪方面的论文)
其它关注的论文:
Alternating Decision Forests.Samuel Schulter, Paul Wohlhart,Christian Leistner, Amir Saffari,Peter M. Roth,Horst Bischof(Forest也是近些年的热点之一。此外,TU Graz视觉组在各种Top会议上很是active。作者将Boosting的思想引入到RF中,对样本分类的难易程度作为样本权重)
Semi-supervised Node Splitting for Random Forest Construction.Xiao Liu, Mingli Song, Dacheng Tao,Zicheng Liu, Luming Zhang, Chun Chen, Jiajun Bu (虽然Forest很热,但是在这类会议上纯粹关于Forest的研究还是不多。因为RF在每个节点进行分裂时需要对每个类别的分布有一个比较稳定的统计,如果labeled样本比较少,那么这个统计就不稳定,导致找到的splitting参数也不好。所以,作者用labeled+unlabeled数据来解决这个问题,采用KDE来估计unlabeled样本属于某个类别的概率。)
Optimizing 1-Nearest Prototype Classifiers.Paul Wohlhart, Michael Donoser, Peter Roth,Horst Bischof (by TU Graz)(真佩服Tu Graz这群researchers,1-NN都能玩出花活来,论文用优化的方法迭代找到一群样本中的prototypes,这样每次NN test时就只需要和prototypes进行距离计算,作者另外说这个方法可以naturally加入metric learning.)
Single-Pedestrian Detection aided by Multi-pedestrian Detection. Wanli Ouyang, Xiaogang Wang
Measuring Crowd Collectiveness.Bolei Zhou,Xiaogang Wang (群体行为分析方面顶尖的组,一作小牛人)
Crossing the Line: Crowd Counting by Integer Programming with Local Features. Zheng Ma,Antoni Chan
Histograms of Sparse Codes for Object Detection.Xiaofeng Ren,Deva Ramanan (feature learning,能够比HoG提供更丰富的纹理描述)
Multi-Source Multi-Scale Counting in Extremely Dense Crowd Images. Haroon Idrees, Imran Saleemi, Mubarak Shah
Human Pose Estimation from Still Images using Body Parts Dependent Joint Regressors.Matthias Dantone,Juergen Gall, Luc Van Gool, Christian Leistner (Gall的Hough Forest令人印象比较深)
Efficient Detector Adaptation for Object Detection in a Video.Pramod Sharma, Ram Nevatia (采用在线训练的adaptive classifier来提高baseline classifier,其中正负样本的在线collection是一个重要点. In a word, 就是用baseline classifier(low threshold)先检测出目标,然后用adaptive classifier(论文里是ferns)来判断是否是虚警)
Robust Multi-Resolution Pedestrian Detection in Traffic Scenes. Junjie Yan, Xucong Zhang, Zhen Lei, Dong Yi, Shengcai Liao, Stan Li (Oral)
Fast multiple-part based object detection using KD-Ferns. Dan Levi, Shai Silberstein, Aharon Bar-Hillel
Online Dominant and Anomalous Behavior Detection in Videos. Mehrsan Javan Roshtkhari, Martin Levine
BoF meets HOG: Feature Extraction based on Histograms of Oriented p.d.f Gradients for Image Classification. Takumi Kobayashi
The SVM-minus Similarity Score for Video Face Recognition.Lior Wolf, Noga Levy
Occlusion patterns for object class detection. Bojan Pepikj, Michael Stark, Peter Gehler, Bernt Schiele
Separable Dictionary Learning. Simon Hawe, Matthias Seibert, Martin Kleinsteuber
Scalable Sparse Subspace Clustering. Xi Peng, Lei Zhang, Zhang Yi