人工智能基础--AI作业1-ML基础

码上游

已于 2023-08-21 13:46:02 修改

阅读量487

点赞数 2

文章标签：开发语言人工智能

于 2023-03-08 20:37:11 首次发布

本文链接：https://blog.csdn.net/pakerder/article/details/129410931

版权

1.监督学习和无监督学习都是机器学习中常用的方法。

监督学习是一种机器学习方法，其中机器学习算法根据给定的输入数据和其对应的输出标签进行训练，以学习如何预测新的输入数据的输出标签。简单来说，监督学习就是通过已知的数据进行学习，从而预测未知的数据。

无监督学习则是一种机器学习方法，其中机器学习算法使用没有标签的输入数据进行训练，以学习数据的隐藏结构和模式。简单来说，无监督学习就是对未知的数据进行学习，从中找到其内在的规律和关系。

2.分类和回归都是机器学习中的基本概念。

分类是指将数据分成不同的类别或标签。例如，将电子邮件分类为“垃圾邮件”或“非垃圾邮件”，将数字图像分类为“狗”或“猫”。分类问题的目标是通过训练一个模型，使其能够自动地将新的输入数据分到正确的类别中。

回归是指对数据进行预测，以输出一个连续的数值。例如，预测房价、销售额等。回归问题的目标是通过训练一个模型，使其能够自动地预测给定输入的输出值。回归问题通常涉及到连续的输出值和输入值之间的关系建模，如线性回归、多项式回归等。

总的来说，分类和回归是机器学习中最常用的两种基本问题类型，两者的主要区别在于输出值的类型。

3.聚类和降维都是机器学习中的基本概念。

聚类是指将数据分成不同的组，每组中的数据都具有相似的特征。例如，将客户根据他们的购买行为分为不同的群组，将文本数据中的相似文章分为一组。聚类问题的目标是将相似的数据聚集在一起，使得组内的数据相似度尽可能高，组间的数据相似度尽可能低。

降维是指将数据的维度从高维度空间降低到低维度空间，同时保留数据的重要信息。例如，将图片从RGB颜色空间转换为灰度颜色空间，将高维度的文本数据转换为低维度的向量表示。降维问题的目标是减少数据的冗余信息和计算成本，同时保留数据的主要特征，以便更好地理解和处理数据。

总的来说，聚类和降维是机器学习中常用的两种数据分析方法，两者都是为了更好地理解和处理数据。

4.损失函数是用来衡量机器学习模型预测结果与真实结果之间差距的一种函数。

在机器学习中，我们通过训练模型来使其能够自动地从数据中学习到模式和规律。而损失函数则是衡量模型预测结果与真实结果之间的差距的一种方法。通常来说，损失函数越小，模型的预测结果就越接近真实结果。

例如，在分类问题中，常用的损失函数是交叉熵损失函数，它可以衡量模型的预测结果与真实结果之间的差异。在回归问题中，常用的损失函数是均方误差损失函数，它可以衡量模型的预测结果与真实结果之间的平均差距。

总的来说，损失函数在机器学习中扮演着非常重要的角色，它帮助我们评估模型的性能，并且优化模型的参数，以使得模型能够更好地适应数据。

5.在机器学习中，我们通常会将数据集分成训练集、测试集和验证集三部分。

训练集是用来训练模型的数据集，模型通过学习训练集中的数据来建立模式和规律。通常来说，训练集占总数据集的比例很高，通常为 60% - 80%。

测试集是用来评估模型性能的数据集，模型在测试集上进行测试，以评估其对未见过的数据的泛化能力。通常来说，测试集占总数据集的比例较小，通常为 10% - 20%。

验证集是用来调整模型参数的数据集，通过验证集上的评估结果来选择模型最佳参数，以避免模型在测试集上出现过拟合或欠拟合的情况。通常来说，验证集占总数据集的比例也比较小，通常为 10% - 20%。

总的来说，训练集、测试集和验证集都是机器学习中非常重要的数据集，它们帮助我们训练出更加准确和泛化能力更强的模型。同时，需要注意的是，训练集、测试集和验证集的划分应该是随机的，并且要保证数据集的代表性和平衡性。

6.过拟合和欠拟合都是机器学习中模型性能不佳的情况。

过拟合指的是模型在训练集上表现非常好，但在测试集上表现很差的情况。这是因为模型在训练过程中过于关注训练集中的细节和噪声，导致其无法泛化到新数据上。过拟合的解决方法包括增加数据量、减小模型复杂度、添加正则化等。

欠拟合指的是模型在训练集和测试集上的表现都很差，这意味着模型无法很好地捕捉数据中的规律和模式。这可能是因为模型太过简单，或者数据中存在着复杂的模式和规律。欠拟合的解决方法包括增加模型复杂度、增加特征数量、改进数据预处理等。

总的来说，过拟合和欠拟合都是机器学习中需要解决的问题，我们需要通过合适的方法和技术来避免或解决它们，以获得更好的模型性能。

7.经验风险和期望风险是机器学习中用来衡量模型性能的两个概念。

经验风险指的是模型在训练集上的表现，也就是模型对于已经见过的数据的预测能力。通常来说，经验风险越小，表示模型在训练集上的表现越好。

期望风险指的是模型在所有可能出现的情况下的表现，也就是模型对于未见过的数据的预测能力。通常来说，期望风险越小，表示模型的泛化能力越强，即能够更好地适应新数据。

在机器学习中，我们的目标是使模型的期望风险最小化，也就是让模型在未见过的数据上的表现最好。为了达到这个目标，我们需要通过训练集来优化模型的参数，以使得模型在训练集上的经验风险尽可能地小，从而提高其泛化能力。

总的来说，经验风险和期望风险都是机器学习中非常重要的概念，它们帮助我们评估和优化模型的性能，从而提高模型的泛化能力。

关注