深度学习方法在机器视觉领域的发展

随着各个行业信息化程度的普及,任何行业所积累的数据会越来越多,但当真正面对海量数据时,各行业才意识到数据处理能力远远不够。目前大多数机器视觉处理系统可以很好地采集、传输和存储图像视频,但是缺乏对其图像视频内容高效准确的分析、识别和挖掘方法。有了深度学习,机器学习才有了许多实际的应用,它还拓展了AI的整体范围。 深度学习将任务分拆,使得各种类型的机器辅助变成可能。

深度学习.jpg

目前,深度学习已经在人工智能的多个应用领域如图像分类、语音识别、自然语言理解等取得了突破性的进展。深度学习由于其优异的效果,也引起了工业界的广泛兴趣,以谷歌、脸谱、微软、百度等为代表的互联网企业已经成为深度学习技术创新的重要力量。

今天,在某些场景中,经过深度学习技术训练的机器在识别图像时比人类更好,比如识别猫、识别血液中的癌细胞特征、识别MRI扫描图片中的肿瘤。谷歌AlphaGo学习围棋,它自己与自己不断下围棋并从中学习。深度学习还在图像恢复和超分辨率、图像质量评价、语义分割与解析、图像内容文本生成、医学图像分析等许多任务中取得了较传统方法更好的结果,大大推动了相互领域技术和方法的发展。

目前的深度学习方法往往依赖大规模数据进行训练。但并非所有的视觉问题都有充足的训练样本,如特定人或物体的检索,罕见物种的识别、医学图像中的稀有病例等,训练数据可能非常稀少或者收集大量样本的代价会很大。于此相对应,人的视觉系统仅需要少量样本就可以识别类别,这很多程度是因为人可以复用在其他领域学习所得知识和经验。近年来小数据样本(Smalldataset)的学习越来越引起研究人员的关注,如何利用小数据样本来进行有效的深度学习,是一个有待解决的挑战性问题。

深度卷积网络采用误差反向传播算法进行参数学习,这就要求训练数据有明确和丰富的监督信息。但在许多实际问题中,对图像进行详细、精确的标定极为耗时(如场景解析中的像素级标签、视频中精细的时空标定等);并且,许多训练数据中监督信息缺失或监督信息包含噪声(如从互联网中收集的照片)。如何利用弱监督、噪声监督、非监督统信息来训练深度网络,对利用大量标定不完全的数据具有重要的实际意义。

深度神经网络往往规模巨大、参数众多。以AlexNet网络为例,虽然输入图像已经被缩小到224×224,但模型仍包含六千万的参数。这使得深度神经网络较难应用于计算和存储资源受限的场合如移动终端、嵌入式系统等。同时,也使得人们很难把高分辨率的图像直接作为深度网络的输入。如何对复杂深度网络模型进行压缩和加速,降低运算和存储消耗,对解决深度学习方法资源受限的难题具有现实意义。

深度学习的发展伴随着它对其它领域的革命过程。朗锐智科(www.lrist.com)认为在过去的数年中,深度学习的应用能力几乎是一种“敢想就能成”的状态。这当然得益于现今各行各业丰富的数据集以及计算机计算能力的提升,同时也要归功于过去近三十年的领域经验。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值