机器学习基本概念

最新推荐文章于 2022-11-09 16:23:10 发布

fzzjoy

最新推荐文章于 2022-11-09 16:23:10 发布

阅读量524

点赞数

分类专栏： AI 文章标签：深度学习神经网络机器学习

本文链接：https://blog.csdn.net/u010275850/article/details/120234740

版权

AI 专栏收录该内容

2 篇文章 0 订阅

订阅专栏

本文介绍了机器学习的基础，包括数据划分、模型训练和调优，以及深度学习的特点和常用框架。重点讲解了NLP、混淆矩阵、ROC曲线、AUC和PR曲线等评估指标，同时阐述了参数与超参数的区别。此外，还讨论了数据集划分、交叉验证和模型选择的重要性。

摘要由CSDN通过智能技术生成

深度学习和机器学习

在这里插入图片描述
机器学习(Machine Learning, ML)，是人工智能的核心，属于人工智能的一个分支，是一个大的领域，是让计算机拥有像人一样的学习能力，模拟和实现人的学习行为和能力，可以像人一样具有识别和判断的能力，可以看作是仿生学。

机器学习的工作方式:

1）选择数据：将你的数据分成三组：训练数据、验证数据和测试数据。
2）模型数据：使用训练数据来构建使用相关特征的模型。
3）验证模型：使用你的验证数据接入你的模型。
4）测试模型：使用你的测试数据检查被验证的模型的表现。
5）使用模型：使用完全训练好的模型在新数据上做预测。
6）调优模型：使用更多数据、不同的特征或调整过的参数来提升算法的性能表现。

常见的15种机器学习算法：
在这里插入图片描述

深度学习（Deep Learning）是机器学习的一种，是它的一个大的分支。实际上指的的深度神经网络学习，普通神经网络由于训练代价较高，一般只有3-4层，而深度神经网络由于采用了特殊的训练方法加上一些技术算法，可以达到8-10层。深度神经网络能够捕捉到数据中的深层联系，从而能够得到更精准的模型，而这些联系不容易被普通的机器学习方法所发觉。

传统机器学习的特征提取主要依赖人工，针对特定简单任务的时候人工提取特征会简单有效，但是并不能通用。

深度学习的特征提取并不依靠人工，而是机器自动提取的。

常用的深度学习框架有：TensorFlow、Pytorch

4种典型的深度学习算法：
在这里插入图片描述

在这里插入图片描述

监督学习：数据有label信息，对输入样本经过模型训练后有明确的预期输出。典型算法：分类和回归；
无监督学习：数据没有label信息，对输入样本经过模型训练后得到什么输出没有预期。典型算法：聚类；
强化学习：强化学习更接近生物学习的本质，因此有望获得更高的智能。它关注的是智能体如何在环境中采取一系列行为，从而获得最大的累积回报。通过强化学习，一个智能体应该知道在什么状态下应该采取什么行为。典型的场景就是打游戏。

NLP（Natural language processing）

深度学习应用的一个分支：自然语言处理。

Confusion Matrix: 混淆矩阵

二分类的混淆矩阵
在这里插入图片描述
其中：
TP(True Positive): 指正确分类的正样本数，即预测为正样本，实际也是正样本。
TN(True Negative): 指正确分类的负样本数，即预测为负样本，实际也是负样本。
FP(False Positive): 指被错误的标记为正样本的负样本数，即实际为负样本而被预测为正样本，所以是False。
FN(False Negative): 指被错误的标记为负样本的正样本数，即实际为正样本而被预测为负样本，所以是False。
TP+FP+TN+FN: 样本总数。
TP+FN: 实际正样本数。
TP+FP: 预测结果为正样本的总数，包括预测正确的和错误的。
FP+TN: 实际负样本数。
TN+FN: 预测结果为负样本的总数，包括预测正确的和错误的。
在这里插入图片描述
补充：
准确率（Accuracy) = 预测正确的样本 / 样本总数 = (TP + TN) / (TP+FP+TN+FN)