机器学习与深度学习

最新推荐文章于 2025-03-14 22:30:08 发布

yoohsummer

最新推荐文章于 2025-03-14 22:30:08 发布

阅读量1k

点赞数

1.机器学习 Maching Learning

卡内基梅隆大学的Tom Michael Mitchell教授在1997年出版的书籍Machine Learning 中对机器学习进行过非常专业的定义，这个定义在学术界内被多次引用。具体定义为：

“如果一个程序可以在任务T上，随着经验E的增加，效果P也可以随之增加，则称这个程序可以从经验中学习”

机器学习是实现人工智能的一种有效手段，目前业界的主要突出应用领域有：计算机视觉、自然语言处理、推荐系统、文本分类。生活中经常用到的比如高速公路上的ETC的车牌识别，苹果手机的Siri，看今日头条时给你推荐的新闻，再比如大家用天猫买东西看评论的时候的评价描述。

机器学习本质上是通过数学算法来解析数据的规律，学习相关的规律且用来预测和决策。机器学习主要分为监督学习，无监督学习和半监督学习三种。从算法上来说有贝叶斯分类，决策树，线性回归，决策树和森林模型，主成分分析，流行学习，k-means聚类，高斯混合模型等等。

2.深度学习Deeping Learning

“深度学习是一种特殊的机器学习，它通过学习将世界表示为嵌套的概念层次结构来实现强大的功能和灵活性，每个概念都是根据更简单的概念定义的，而更抽象的表示是根据较不抽象的概念计算的”

深度学习是一种特殊的机器学习，深度学习使用的主要算法是DNN（深度神经网络），CNN（卷积神经网络），RNN（循环神经网络），LSTM（长短期记忆网络）。通过这些手段，深度学习在视觉识别，语音识别，自然语言处理（NLP）等领域取得了使用传统机器学习算法所无法取得的成就。

2.机器学习与深度学习的比较

2.1数据依赖性

深度学习与传统机器学习之间最重要的区别在于其随着数据规模的增加而表现出来。当数据很小时，深度学习算法表现不佳。这是因为深度学习算法需要大量数据才能完美理解。另一方面，在这种情况下，传统的机器学习算法及其手工制作的规则占主导地位。下图总结了这一事实。

2.2硬件依赖性

深度学习算法在很大程度上依赖于高端机器，这与传统的机器学习算法相反，后者可以在低端机器上运行。这是因为深度学习算法的要求包括GPU，它是其工作的一个组成部分。深度学习算法固有地执行大量矩阵乘法运算。可以使用GPU有效地优化这些操作，因为GPU是为此目的而构建的。

2.3特征工程

特征工程是将领域知识放入特征提取器的创建过程中的过程，以降低数据的复杂性并使模式对于学习算法更加可见。就时间和专业知识而言，这个过程既困难又昂贵。

机器学习的特征工程步骤是要靠手动完成的，而且需要大量领域专业知识，大多数应用的功能需要由专家识别，然后根据域和数据类型进行手动编码。例如，特征可以是像素值，形状，纹理，位置和方向。大多数机器学习算法的性能取决于识别和提取特征的准确程度。
深度学习尝试从数据中学习高级特征，通常由多个层组成，它们通常将更简单的模型组合在一起，将数据从一层传递到另一层来构建更复杂的模型。通过训练大量数据自动得出模型，不需要人工特征提取环节。因此，深度学习减少了为每个问题开发新特征提取器的任务。

2.4问题解决方法

当使用传统的机器学习算法解决问题时，通常建议将问题分解为不同的部分，单独解决它们并将它们组合起来得到结果。相反，深度学习主张端到端地解决问题。

我们举一个例子来理解这一点。

假设您有多个对象检测任务。任务是确定对象是什么以及它在图像中的位置。

在典型的机器学习方法中，您可以将问题分为两个步骤：对象检测和对象识别。首先，您将使用像grabcut这样的边界框检测算法来浏览图像并查找所有可能的对象。然后，在所有已识别的对象中，您将使用对象识别算法（如带有HOG的SVM）来识别相关对象。

相反，在深度学习方法中，您将完成端到端的过程。例如，在YOLO网（这是一种深度学习算法）中，您将传入一个图像，它将给出该位置以及对象的名称。

2.5执行时间

通常，深度学习算法需要很长时间才能进行训练。这是因为深度学习算法中有如此多的参数，训练它们需要比平时更长的时间。最先进的深度学习算法ResNet大约需要两周时间才能从头开始训练。虽然机器学习相对需要更少的时间进行训练，但从几秒到几小时不等。

这在测试时间完全颠倒了。在测试时，深度学习算法运行时间要少得多。然而，如果将其与k近邻（一种机器学习算法）进行比较，则测试时间会随着数据大小的增加而增加。虽然这不适用于所有机器学习算法，但其中一些算法的测试时间也很短。

2.6可解释性

最后但并非最不重要的是，我们将可解释性作为比较机器学习和深度学习的一个因素。

我们来举个例子吧。假设我们使用深度学习来为论文提供自动评分。它在得分方面的表现非常出色，接近人类表现。但这是一个问题。它没有揭示为什么它给出了这个分数。事实上，你可以通过数学方法找出深层神经网络的哪些节点被激活，但我们不知道神经元应该建模的是什么以及这些神经元层共同做了什么。所以我们无法解释结果。

另一方面，像决策树这样的机器学习算法为我们提供了清晰的规则，为什么它选择了它所选择的内容，因此特别容易理解其背后的推理。因此，决策树和线性/逻辑回归等算法主要用于工业中的可解释性。

3.机器学习和深度学习现在在哪里应用？

维基文章概述了应用机器学习的所有领域。这些包括：

计算机视觉：适用于车牌识别和面部识别等应用。
信息检索：适用于搜索引擎，文本搜索和图像搜索等应用程序。
营销：用于自动电子邮件营销，目标识别等应用
医疗诊断：用于癌症鉴定，异常检测等应用
自然语言处理：用于情感分析，照片标记等应用
在线广告等
---------------------
作者：代码帮
来源：CSDN
原文：https://blog.csdn.net/ITLearnHall/article/details/81911084
版权声明：本文为博主原创文章，转载请附上博文链接！