虽然这些术语中都有相对特定的含义,但在某些方面既有重叠,也有一些区别,不过都离不开大数据。伴随在数据处理真正的突破,也势必会带来一些不可避免的炒作。而正确的理解这些术语便于我们正确的使用它们。
机器学习
在最基本的层面上,机器学习是指任何类型的计算机程序,可以自己“学习”,而不必由人去编程。
这个术语最早起源于阿兰·图灵(Alan Turing)在 1950 年发表的一篇著名论文“计算机械与人工智能”,就提出了“机器人能思考吗?”
今天,机器学习是一个广泛使用的术语,涵盖了许多类型的程序,多数在大数据分析和数据挖掘中运行。实际上的应用大多数为预测性计划(包括垃圾邮件过滤,产品推荐和欺诈检测)提供的“大脑”就是机器学习算法。
▲线性分类算法
数据科学家将熟悉监督机器学习与无监督机器学习之间的差异,以及综合模型和使用方法技术的组合,以及结合监督和无监督方法的半监督学习。
监督学习是训练神经网络和决策树的最常见技术。在监督学习中,用户训练程序以基于已知和标记的数据集生成答案。
与监督学习不同,无监督学习中数据没有任何标签或者说相同的标签。针对数据集,无监督学习就能判断出数据有两个不同的聚集簇。无监督学习算法可能会把这些数据分成两个不同的簇。所以叫做聚类算法。无监督学习有着大量的应用。它用于组织大型计算机集群。第二种应用就是社交网络的分析。
数据科学家可以使用一系列技术和语言来编写机器学习算法,包括Java,Python,Scala等。他们还可以使用预先构建的机器学习框架来加速过程; Mahout是Apache Hadoop上受欢迎的一个机器学习框架,而Apache Spark的MLlib库已经成为一个标准。
深度学习
深度学习是机器学习的一种形式,可以利用监督或无监督的算法,或两者兼而有之。虽然不一定是新的,但深度学习最近人气激增,作为加速解决某些困难类型的计算机问题方法,最显著的应用是计算机视觉和自然语言处理(NLP)领域。
深度学习是基于机器学习理论的表征学习(或特征学习)分支。通过分层学习过程提取高级,复杂的抽象作为数据表示,深度学习模型比标准机器学习方法更快地产生结果。在简单的英文中,一个深入的学习模式将会学习本身重要的特征,而不是要求数据科学家手动选择相关的特征,例如猫图像中发现的耳朵的一致性。
▲深度学习上猫的图片
深层次学习中的“深层次”来源于深层学习模式,通常是神经网络。卷积神经网络(CNN)可以由许多层次的模型组成,其中每层从前一层获取输入,处理它,并以菊花链方式将其输出到下一层。由Google的DeepMind团队开发的AlphaGo击败了世界冠军,许多人认为这是一个深度学习兴盛的标志。
▲神经网络可以有很多隐藏层
深度学习今天如此受欢迎,主要有两个原因。首先,发现CNN在GPU上运行得更快,例如NVidia的Tesla K80处理器。其次,数据科学家意识到,我们收集的庞大的数据库可以作为一个大规模的训练资料库,从而使CNN大大提高了计算机视觉和NLP算法的准确性。
而目前我们看到的开发自动驾驶的大部分进展可归功于使用CNN在GPU上的深度学习进展,这有助于促进深度学习和更广泛的人工智能领域的进一步发展。
人工智能
像机器学习和深度学习一样,人工智能也不是“新的”,但它绝对体现了一种复兴。人们使用这个词的方式也在变化。
当图灵第一次设计他的测试时,人工智能这个词主要保留在一个可以广泛模仿人类智慧的技术上。在这过去是一件遥不可及的事,就像我们今天谈时间旅行一样。
▲短命的Tay, Microsoft's AI chatbot
今天,人工智能或AI通常用于指任何类型的机器学习程序。在这方面,它开始取代“大数据”及其挂钩的“高级分析”和“预测分析”。对于那些不喜欢“大数据”一词的人,这可能是一件好事。
有人因为人工智能的发展而感到担忧,马云则强调不必担忧。“我认为未来机器会比人类更聪明,但未必会比人类更明智。”马云表示,他希望人类在技术上被机器战胜。但人类的智慧是核心,应该充分使用这些机器在应对疾病、贫穷等方面发挥作用。
作者:老鱼
来源:IT168
原文链接:机器学习,深度学习和AI:有什么区别?