五月第二周,盘点本周新开源或即将开源的CV代码,涵盖方向广泛,不仅涉及到技术创新,还涉及多种CV应用,希望对大家有帮助。
图像分割
[1].A Hand Motion-guided Articulation and Segmentation Estimation
手部运动引导的关节模型估计与分割
作者 | Richard Sahala Hartanto, Ryoichi Ishikawa, Menandro Roxas, Takeshi Oishi
单位 | 东京大学
论文 | https://arxiv.org/abs/2005.03691
代码 | https://github.com/cln515/Articulation-Estimation
[2].A Sim2Real Deep Learning Approach for the Transformation of Images from Multiple Vehicle-Mounted Cameras to a Semantically Segmented Image in Bird’s Eye View
Sim2Real深度学习方法,用于将图像从多个车载摄像头转换为鸟瞰图中的语义分割图像
作者 | Lennart Reiher, Bastian Lampe, Lutz Eckstein
单位 | 德国联邦教育与研究部;亚琛工业大学
论文 | https://arxiv.org/abs/2005.04078
代码 | https://github.com/ika-rwth-aachen/Cam2BEV
[3].BiSeNet V2: Bilateral Network with Guided Aggregation for Real-time Semantic Segmentation
BiSeNetV2 实时语义分割算法 的非官方TF实现,在cityscapes验证集上达到71.563 miou,在GTX1070 GPU上达到 83fps。
作者 | Changqian Yu, Changxin Gao, Jingbo Wang, Gang Yu, Chunhua Shen, Nong Sang
单位 | 华中科技大学;阿德莱德大学;香港中文大学;腾讯
论文 | https://arxiv.org/abs/2004.02147
代码 | https://github.com/MaybeShewill-CV/bisenetv2-tensorflow
[4]Class-Incremental Learning for Semantic Segmentation Re-Using Neither Old Data Nor Old Labels
既不使用旧数据,也不使用旧标签的语义分割的类增量学习
作者 | Marvin Klingner, Andreas Bär, Philipp Donn, Tim Fingscheidt
单位 | Technische Universitat Braunschweig
论文 | https://arxiv.org/abs/2005.06050
代码 | https://github.com/ifnspaml/CIL_Segmentation(将开源)
[5].Detection and Retrieval of Out-of-Distribution Objects in Semantic Segmentation
在语义分割中检测和检索不在训练集分布内的目标,在Cityscapes数据集上训练,在A2D2数据集测试。
作者 | Philipp Oberdiek, Matthias Rottmann, Gernot A. Fink
单位 | 多特蒙德工业大学;伍珀塔尔大学
论文 | https://arxiv.org/abs/2005.06831
代码 | https://github.com/RonMcKay/OODRetrieval
目标检测
#半监督目标检测#
[6].A Simple Semi-Supervised Learning Framework for Object Detection
谷歌提出新算法STAC,使用在无标签的图像上检测到的目标的伪标签训练更新模型,在VOC07数据集上改进了AP0.5从76.3到79.8,在COCO数据集上仅使用5%标签数据实现 24.38mAP(相对比,监督方法使用10%标签数据达到23.86 mAP)。
作者 | Kihyuk Sohn, Zizhao Zhang, Chun-Liang Li, Han Zhang, Chen-Yu Lee, Tomas Pfister
单位 | 谷歌
论文 | https://arxiv.org/abs/2005.04757v1
代码 | https://github.com/google-research/ssl_detection/
#拥挤场景目标检测#
[7].IterDet: Iterative Scheme for ObjectDetection in Crowded Environments
目标检测往往会生成大量的目标候选框,通常的做法是使用NMS过滤目标。但对于拥挤场景的目标检测,这往往会把靠的过近的正确的目标个体去掉了。
为此,本文发明了一种迭代的目标检测方法,目标检测一次后图像被再一次输入网络,但此前检测结果被保留,使其不再被检测到。这种迭代检测机制大大改进了拥挤场景的目标检测,代码已开源。
作者 | Danila Rukhovich, Konstantin Sofiiuk, Danil Galeev, Olga Barinova, Anton Konushin
单位 | 三星公司
论文 | https://arxiv.org/abs/2005.05708v1
代码 | https://github.com/saic-vul/iterdet
#烟雾识别#
[8].RISE Video Dataset: Recognizing Industrial Smoke Emissions
RISE视频数据集:识别工业烟气排放,代码与数据集都是开源的
作者 | Yen-Chia Hsu, Ting-Hao (Kenneth)Huang, Ting-Yao Hu, Paul Dille, Sean Prendi, Ryan Hoffman, Anastasia Tsuhlares, Randy Sargent, Illah Nourbakhsh