残差学习,152层网络,微软夺冠2015 ImageNet计算机视觉识别挑战

摘要:该研究团队还使用了一个“残差学习”原则来指导神经网络结构的设计。“残差学习”最重要的突破在于重构了学习的过程,并重新定向了深层神经网络中的信息流,很好地解决了此前深层神经网络层级与准确度之间的矛盾。

美国东部时间2015年12月10日,微软亚洲研究院视觉计算组在2015 ImageNet计算机识别挑战赛中凭借深层神经网络技术的最新突破,以绝对优势获得图像分类、图像定位以及图像检测全部三个主要项目的冠军。同一时刻,他们在另一项图像识别挑战赛MS COCO(Microsoft Common Objects in Context challenges,常见物体图像识别)中同样成功登顶,在图像检测和图像分割项目上击败了来自学界、企业和研究机构的众多参赛者。

在此次挑战赛中,微软亚洲研究院的研究团队使用了一种前所未有的深度高达百层的神经网络,这比以往任何成功使用的神经网络层数多5倍以上,从而在照片和视频物体识别等技术方面实现了重大突破。

ImageNet挑战赛去年获胜的系统错误率为6.6%,而今年微软亚洲研究院视觉计算组的系统错误率已经低至3.57%。事实上,该研究团队早在今年一月就首先实现了对人类视觉能力的突破。当时,在题为“Delving Deep into Rectifiers: Surpassing Human-Level Performance on ImageNet Classification”的论文中,他们系统的错误率已降低至4.94%。此前同样的实验中,人眼辨识的错误率大概为5.1%。

微软全球资深副总裁、微软亚太研发集团主席兼微软亚洲研究院院长洪小文博士表示:“微软亚洲研究院视觉计算组在此次ImageNet挑战赛中所取得的出色成绩,不仅是微软在深层神经网络的研究和应用上所取得的科学突破,同时也代表着计算机视觉技术在目标识别方面的又一次飞跃。我对研究组多年来的技术积累、探索和成果倍感骄傲,同时也对这一突破对其它研究领域的推动以及相关产品的转化充满期待。”

微软亚洲研究院视觉计算组首席研究员孙剑博士带领的团队在深层神经网络方面进行了算法的更新,并称之为“深层残差网络”(deep residual networks)。目前普遍使用的神经网络层级能够达到20到30层,在此次挑战赛中该团队应用的神经网络系统实现了152层。该研究团队还使用了一个全新的“残差学习”原则来指导神经网络结构的设计。“残差学习”最重要的突破在于重构了学习的过程,并重新定向了深层神经网络中的信息流。它很好地解决了此前深层神经网络层级与准确度之间的矛盾。孙剑表示:“从我们极深的深层神经网络中可以看出,‘深层残差网络’力量强大且极为通用,可以预见它还能极大地改善其它计算机视觉问题。”

微软亚洲研究院多年来在计算机视觉领域的研究成果已经转化到众多微软的智能产品和服务中,包括微软牛津计划中的人脸识别和图像识别API、Windows 10中的Windows Hello“刷脸”开机功能、必应的图像搜索、微软小冰的多个图像“技能”,OneDrive中的图片分类功能,以及广受好评的口袋扫描仪Office Lens等等。

ImageNet是一个计算机视觉系统识别项目,也是目前世界上图像识别最大的数据库。ImageNet挑战赛每年举办一次,由来自全球顶尖高校、企业及研究机构的研究员组织举办,近年来已经成为计算机视觉领域的标杆。MS COCO数据库由微软资助建立,其挑战赛目前由学术界几所高校联合组织,独立运行。

  • 2
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
残差网络是一种被广泛应用于图像识别问题的深度学习模型。在传统的深度卷积神经网络中,随着数的增加,网络越深,梯度消失和梯度爆炸等问题会变得更加显著。为了解决这一问题,残差网络提出了“跳跃连接”的概念。 跳跃连接是指将输入数据直接传递到网络中的后续,使得网络可以学习输入数据的残差信息。对于每一个卷积的输出,残差网络会对其进行加权求和,将其与输入数据相加后再传递给下一。这样做的好处是,在梯度反向传播过程中,梯度可以更加直接地传递到浅网络,防止梯度消失和梯度爆炸的情况发生。 在图像识别任务中,使用残差网络可以提高识别准确率。通过加入跳跃连接,残差网络能够更好地捕捉到图像中的细节和特征,从而提高了模型的整体性能。残差网络在图像识别领域的应用也得到了广泛的验证,并被证明能够在大规模数据集上取得较好的效果。 TensorFlow是一个广泛应用于机器学习深度学习领域的开源框架,它提供了丰富的工具和库来支持残差网络的实现和训练。TensorFlow可以有效地利用GPU加速计算,提高模型训练的效率。通过调用TensorFlow的API接口,我们可以方便地搭建残差网络模型,加载训练数据并进行模型训练和推理。同时,TensorFlow还提供了可视化工具,方便我们观察和分析模型的训练过程,帮助我们优化模型的性能。 总结来说,残差网络是一种利用跳跃连接解决深度神经网络中梯度消失和梯度爆炸问题的方法,可以提高图像识别任务的准确率。TensorFlow作为一个强大的开源框架,为残差网络的实现和训练提供了便利的工具和支持。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值