工业视觉中的目标检测——兼谈天池大赛优胜方案

https://www.jishuwen.com/d/2wwU

目标检测是计算机视觉领域研究最火热的领域,这从计算机视觉顶会CVPR相关论文中数量就能看得出来。

目标检测应用范围广泛,上至卫星遥感,下至自动驾驶,大到鲸鱼保护,小到生物细胞分析,都有其用武之地。

我们在论文中常见的MS COCO数据集,多以生活类自然场景中的目标为主,如下图:

做一个通用的目标检测器,当然很有意思,但在工业视觉领域有很多特定的目标,如果能解决好了,往往非常具有商业价值。

CV君有好几位朋友创业方向都选择了工业视觉领域,这个领域商业化模式清晰,足够垂直,国家也鼓励工业 4.0 。一套自动化的产品瑕疵(缺陷)检测系统,一年就可以帮工厂省几百万甚至上千万资金。

阿里天池平台曾经举办过大量的数据竞赛,让人印象深刻的计算机视觉比赛比如 津南数字制造算法挑战赛【赛场二】 X光图像的违禁物品检测分割, 2018广东工业智造大数据创新大赛—智能算法赛 铝型材表面瑕疵识别 ,和最近刚上线的 百万奖金! 天池发起广东工业制造创新大赛 赛场一: 布匹疵点智能识别 ,都与目标检测相关。

布匹疵点智能识别比赛图像示例

布匹 疵 点智能 识别比赛目标标注

比赛嘛,当然是追求高精度,下面将结合一些最新的论文和天池上目标检测相关比赛的优胜方案,谈谈如何提高模型精度。

首先要推荐的是亚马逊李沐团队的论文及代码:

Bag of Freebies for Training Object Detection Neural Networks

https://arxiv.org/abs/1902.04103v1

https://github.com/dmlc/gluon-cv

作者们在文章主要公布了以下训练实用技巧:

1.视觉一致的Image Mixup(Visually Coherent Image Mixup for Object De- tection)

Image Mixup已经成功用于图像分类的样本增广,在很多比赛中也经常被冠军所用,做法非常简单,图像简单按照比例进行像素混合,如下图:

同样,将带有目标的两幅图像也可以像素混合,生成新的图像含有含有原来的目标,用在目标检测的Image Mixup示意如下:

2.分类头标签平滑(Classification Head Label Smoothing)
3.数据预处理(Data Pre-processing)

主要是随机几何变换和颜色扰动。

4.训练调度程序改造(Training Scheduler Revamping)

改进学习率的衰减方法,使用cosine schedule 代替step schedule取得了更好的结果,如下图:

5.同步批归一化(Synchronized Batch Normalization)

为了方便多GPU训练(如果你有多个GPU的话。。。)。

6.随机形状训练(Random shapes training for single-stage object detection networks)

通过组合以上目标检测训练技巧, 训练Faster RCNN和YOLOv3之后,获得的精度增益,相同的算法最多竟有+4.0%AP的增长 (COCO数据集)!

另外,研究往届比赛的优胜方案也能对我们有所启发。

冠军们使用什么框架?

商汤开源的mmdetection, 和Facebook开源的Detectron 是被提及最多的目标检测框架,它们本身实现了大量state-of-the-art算法,而且用户众多,有问题也比较容易解决,是 大 家快速参与比赛的 首选。

https://github.com/open-mmlab/mmdetection

https://github.com/facebookresearch/Detectron

选择哪一种目标检测算法?

这时候不能不提到 Cascade RCNN,曾经在多个比赛中斩获冠军。

Cascade R-CNN升级!目标检测制霸COCO,实例分割超越Mask R-CNN

目前也是COCO数据集上的最高分获得者。

但也不能完全迷信论文里的State-of-the-art,在 铝型材表面瑕疵识别比赛中,冠军使用的模型的基础结构是Faster RCNN(但也是做了大量改进)。

详见:

https://tianchi.aliyun.com/forum/postDetail?spm=5176.12586969.1002.3.743c4cb2ixWGxm&postId=38469

数据增广和模型融合是必不可少的!

几乎所有的优胜团队都会提到数据增广,图像翻转、旋转、平移、颜色扰动等。

尤其是处理类别不平衡问题,有时候甚至成为比赛获胜的关键。

在目标检测领域还有一大难点是小目标的检测,这里强烈推荐大家参考论文:

Augmentation for small object detection

https://arxiv.org/abs/1902.07296

通过造数据的方式使得小目标类别在整体更均衡,可以有效改进算法效果。

模型融合也是非常关键的,大家可以从铝型材表面瑕疵识别冠军方案的这张图中看出来:

天池优胜方案链接:

https://tianchi.aliyun.com/competition/entrance/231703/forum

https://tianchi.aliyun.com/competition/entrance/231682/forum

鼓励大家去天池玩一下布匹疵点智能检测比赛,在实际问题中提高技术水平!

  • 0
    点赞
  • 15
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
### 回答1: 阿里云天池大赛是一个非常有名的数据科学竞平台,其机器学习竞是其的一个重要组成部分。在这个竞,参者需要使用机器学习算法来解决各种各样的问题,例如图像识别、自然语言处理、推荐系统等等。 机器学习竞的解题过程通常包括以下几个步骤: 1. 数据预处理:参者需要对提供的数据进行清洗、特征提取、数据转换等操作,以便于后续的建模和训练。 2. 模型选择:参者需要选择适合当前问题的机器学习算法,并对其进行调参和优化。 3. 模型训练:参者需要使用训练数据对模型进行训练,并对训练过程进行监控和调整。 4. 模型评估:参者需要使用测试数据对模型进行评估,以确定其在实际应用的性能表现。 5. 结果提交:参者需要将最终的模型结果提交到竞平台上进行评估和排名。 在机器学习竞,成功的关键在于对问题的深入理解和对机器学习算法的熟练掌握。同时,参者还需要具备良好的团队合作能力和沟通能力,以便于在竞取得更好的成绩。 ### 回答2: 阿里云天池大赛是一个非常受欢迎的机器学习竞平台,它汇集了大量来自世界各地的数据科学家,分享了一系列有趣的竞和可用的数据集,供参选手使用。机器学习篇,我们将解析一些常见的阿里云天池大赛题目,让大家对机器学习竞有更深入的了解。 一、题选取 阿里云天池大赛题通常与商业、医疗等复杂领域相关,选择数据集时要了解行业背景和数据质量,以准确地判断模型的准确性和适用性。此外,在选择题时,还要考虑与参选手一起合作的可能性,以及他们可能使用的算法和技术。因此,为了成功解决题,参者应当仔细研究题目的背景、数据、分析目标等内容,有助于更好地理解问题及其解决方案。 二、数据清洗 参者在使用数据时,需要对其进行实质性的预处理和清洗工作,以减少不准确的数据对结果的影响。预处理和清洗包括基本的数据处理,例如缺失值、异常值和重复值的处理,还需要利用可视化和探索性数据分析等技术来检查数据的分布情况、相互关系和异常值等问题。 三、特征选择 在构建模型之前,参选手必须确定哪些特征会对问题的解决产生实际影响。这个过程称为特征选择,它旨在通过保留最相关的特征来减少模型复杂性,提高准确性,并且还有助于减少数据集的维数。特征选择包括基于统计学和机器学习的算法,同时应该考虑特征的相关性和重要性。 四、建模和评估 参者在解决问题时,需要考虑使用何种算法,以及如何构建对应的模型。此外,还需在不同的算法和模型之间进行比较,并选择最优模型。最后,应该针对模型进行评估,以确保各种重要性能指标(例如准确性,召回率,精确度等)都得到最佳表现。 总的来说,机器学习是一种复杂而令人兴奋的技术,参者要考虑数据质量、数据清洗、特征选择、建模和评估等诸多因素。通过参加阿里云天池大赛,大家可以不断学习和练习,不仅提升自己的技能,同时还有机会获得丰厚的奖励。 ### 回答3: 阿里云天池大赛是一个集数据竞、人才选拔、行业交流、技术分享、产学研合作等多种功能于一体的大型平台。其,机器学习篇的题挑战包括了各种典型机器学习场景,旨在挖掘数据价值,提高数据应用和解决实际问题的能力。 在机器学习篇的,常见的任务包括分类、回归、聚类、推荐等,其分类问题是最常见的任务之一。分类可以分为二分类、多分类、超大规模分类等多个子类型。对于分类问题,大家需要学习分类算法,如KNN、NB、SVM、LR、GBDT、XGBoost等,并熟悉如何调参等技巧。 回归问题主要是根据给定的样本数据,预测一个连续的数值。回归问题旨在找到独立变量(X)和连续依赖变量(Y)之间的关系,以便使用该模型来预测连续依赖变量的值。对于回归问题,大家需要掌握线性回归、岭回归、Lasso回归、ElasticNet回归等算法。 聚类问题是将相似的数据划分到同一类别,相似度较高,不同类别之间相似度较低。对于聚类问题,大家需要学习如何使用K-means、DBSCAN、Hierarchical聚类算法。 推荐问题是根据用户的行为习惯,预测用户的需求,以便将相应的内容推荐给用户。推荐问题的数据通常包括用户的行为、物品的属性和用户的评分。推荐问题常用的算法包括CF、ALS、LFM等。除此之外,还有深度学习在图像识别、语音识别、自然语言处理、推荐、游戏AI等方面具有广泛的应用,如CNN、RNN、LSTM、GAN等。 总之,机器学习篇的题挑战涉及到各种典型机器学习算法和应用场景,需要大家掌握基础理论和实践技巧,并多参加实战项目和比练习,不断提升自己的能力和水平。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值