深度学习座下的四大神兽:计算能力、算法、数据、场景

转载 2016年08月29日 17:39:47

1

如今越来越多的人愿意和自己的虚拟私人助理交谈,只需要动动嘴就可以让Siri/Alexa/Rokid帮你完成发微信、订车票、设闹钟这样的闲事,还能提醒你吃药、开会,这样一个不需要付工资的贴心小棉袄怎么会不受喜爱呢?虚拟助理正在一步步接近现实中的私人助理,而背后支持它的正是深度学习的技术除了虚拟助理之外,深度学习技术还将是未来计算机视觉、自动驾驶、语音识别等多个领域的核心技术。而深度学习实践的四个关键要素:计算能力、算法、数据和应用场景,就像四大护法神兽一样保证了深度学习的应用和实践,缺一不可。

深度学习是以不少于两个隐含层的神经网络对输入进行非线性变换或表示学习的技术,通过构建深层神经网络,进行各项分析活动。深层神经网络由一个输入层,数个隐层,以及一个输出层构成。每层有若干个神经元,神经元之间有连接权重。每个神经元模拟生物的神经细胞,而结点之间的连接模拟神经细胞之间的连接。总结起来是这个样子的:

这种流向图的一个特别属性是深度(depth):从一个输入到一个输出的最长路径的长度。深度学习并非一个新的概念,但在2006年由Hinton等人引领了一波爆发。然而近年来虽然许多人都在谈论深度学习,但这项技术在实际应用时到底有哪些坑?创办一家成熟的依赖深度学习的公司需要哪些要素?以下是我们的看法:

计算能力

首先,深度神经网络复杂,训练数据多,计算量大。深度神经网络中神经元多,神经元间连接数量也相当惊人。从数学的角度看,每个神经元都要包含数学计算(如Sigmoid、ReLU或者Softmax函数),需要估计的参数量也极大。语音识别和图像识别应用中,神经元达数万个,参数数千万,模型复杂导致计算量大。所以计算能力是深度学习应用的基础。

不仅如此,计算能力还是推动深度学习的利器,计算能力越强,同样时间内积累的经验就越多、迭代速度也越快,百度首席科学家吴恩达博士认为深度学习的前沿正转移到高性能计算(HPC),这也是他目前在百度的工作重心之一,吴博士认为深度学习上的很多成功得益于主动地追求可用的计算能力,2011年Jeff Dean(谷歌第二代人工智能学习系统Tensorflow的设计者之一)创立并领导了谷歌深度学习小组,使用谷歌云扩展深度学习;这使得深度学习得以推向工业界。在2013年,科茨博士等人建立了第一个HPC式的深度学习系统,可扩展性提升了1-2个数量级,使深度学习有了革命性的进步——计算能力这种对于深度学习的支撑与推动作用是不可替代的。

目前这方面技术处于领先地位的还是像百度、谷歌这样的大型互联网公司,当然也有一些初创公司在该领域颇有成就,由百度深度学习研究院负责人余凯博士设计的深度神经网络芯片相比传统的CPU芯片能够支持深度神经网络中图像、语音、文字、控制等方面的任务而不是去做所有事情,这样比在CPU上用软件要高效,会提高2-3个数量级。

算法

在计算能力变得日益廉价的今天,深度学习试图建立大得多也复杂得多的神经网络,我们可以把算法理解为深度学习的神经网络或是计算思维,这种神经网络越复杂,捕捉到的信号就越精确,目前比较常见的算法包括深度信念网络(Deep Belief Networks)、卷积神经网络(ConvolutionalNeural Networks)、受限玻尔兹曼机(Restricted BoltzmannMachine)和堆栈式自动编码器(Stacked Auto-encoders),以深度卷积神经网络为代表的监督学习方法目前来说是最有效也是使用最多的。

但目前问题在于大家把专注度放在了数据与运算,因为神经网络本身差异不会很大,并且神经网络的核心算法提升起来太困难,仍然面临着像局部最优问题、代价函数与整个神经网络系统的设计等问题,但这也给众多创业公司以新的思路,何不反其道而行之,避开那载着千军万马的“独木桥”,如果能将算法优化,前途也是不可限量的。

数据

如今深度学习正迅速成为高级数据分析领域的热门话题,而数据的绝对量是促进深度学习工具和技术发展的一个关键因素。Affectiva的首席科学家和研究部总监DanielMcDuff表示,新兴公司积累了足够的数据后,技术才能更好地发挥作用。对于那些深度学习的应用,不仅开发时需要大量的数据训练、完善,在产品推广之后更加需要实时用户数据,不断进行迭代、更新。

中国在深度学习的竞争中还是有很大机会,可获取的互联网数据,以及低成本的众包劳动,将为中国公司带来海量的数据和极低的数据标注的成本。但是国内市场面临的问题在于大量数据都被BAT等互联网巨头控制,初创公司很难拿到数据去完善、更新深度学习的神经网络,尤其是在产品推出之后,还有可能面临大公司的恶意排挤,获取数据更是难上加难,不说是夹缝中求生存也差不多了吧。

应用场景

深度学习技术目前应用的场景不多,最普遍也是最成功的领域就是语音识别和图像处理这两个应用场景了,之前提到的三大神兽——计算能力、算法和数据属于开发端,应用场景则属于消费端层面,随着未来深度学习技术的不断发展以及用户的需求提升,深度学习的应用场景将越来越多,比如许多智能手机内置的人脸识别功能来对照片进行分类,已经可以达到相当的准确率;支付宝等金融工具也很可能采用人脸识别以提高安全性……未来的深度学习一定不仅仅局限于语音识别和图像识别这两个领域,还有更多的可能性。对于那些初创公司来说,与其和谷歌、Facebook、Amazon、BAT等拥有十多年数据沉淀的大公司竞争这一成熟市场,还不如去发展属于自己的某一片小天地。

如今深度学习的火爆程度不弱于任何其他的领域,互联网巨头们都在想方设法分这块蛋糕,事实上想要做好深度学习计算能力、算法、数据、应用场景这四大护法神兽缺一不可,而BAT等巨头在这些方面都占尽资源上的优势,对于初创公司来说很难四点兼顾,尤其是数据方面,所以利用自身的比较优势抓住其中一点进行创新,无论是计算能力、算法还是应用场景上,只要有创新之处,就能帮助你在市场中掌握主动权。

转盘旋转算法

旋转算法。

【深度学习-CNN】CNN中的参数与计算量

一个卷积神经网络的基本构成一般有卷积层(convolutional layer)、池化层(pooling layer)、全连接层(fully connection layer)。本文以caffe中的L...

分类算法应用场景实例二十则

本文整理了18个天池、DataCastle、CCF中可使用分类算法处理的问题场景。 1 O2O优惠券使用预测          以优惠券盘活老用户或吸引新客户进店消费是O2O的一种重要营销方式。然而...

深度学习的几个实际小应用!

深度学习,机器学习这些名词大家都有一定了解。深度学习类似于我们的大脑计算,可以高效率地处理执行任务。此外,需要重视的一点是,深度学习系统与传统的符号计算平台非常不同,正如人类与计算机的计算方式不同一样...

机器学习(二) 学习规划及资料汇总

****************************************************************************************************...

汤晓鸥谈深度学习三大核心要素:算法设计、高性能的计算能力以及大数据

汤晓鸥谈深度学习三大核心要素:算法设计、高性能的计算能力以及大数据 2017-05-21 15:02:28    深度学习    0 0 0 昨日(5月20日),香港中文大学...

Hadoop计算能力调度器算法解析

1. 本文描述了hadoop中的计算能力调度器(Capacity Scheduler)的实现算法,计算能力调度器是由Yahoo贡献的,主要是解决HADOOP-3421中提出的,在调度器上完成HOD(H...
  • LW_GHY
  • LW_GHY
  • 2016年06月22日 23:41
  • 514

物理学上四大神兽之拉普拉斯妖是指什么

拉普拉斯妖是在1814年由法国的一名数学家名为皮耶尔·西蒙·拉普拉斯的人提出的。拉普拉斯在青年的时候就已经在数学方面显示出他的天赋,18岁时就去了巴黎从事数学工作。当时想向法国的知名学者达朗贝尔求教,...
  • eit520
  • eit520
  • 2017年03月24日 16:40
  • 3936

深度学习(Bengio大神著作)

  • 2016年11月05日 23:20
  • 31.67MB
  • 下载

如何用python制作一个锻炼计算能力的exe小程序-学习笔记11-pyinstaller

首先,要编写出合格的py文件。这个可以在我的前一篇文章中找到 http://blog.csdn.net/qq_26948675/article/details/53130516 然后,要安装p...
内容举报
返回顶部
收藏助手
不良信息举报
您举报文章:深度学习座下的四大神兽:计算能力、算法、数据、场景
举报原因:
原因补充:

(最多只允许输入30个字)