Datawhale AI夏令营第五期深度学习入门（1）-CSDN博客

本文链接：https://blog.csdn.net/Kesenal/article/details/141430049

今天，我们先从机器学习中的概念开始学习。

一、机器学习中的重要概念

机器学习 (Machine Learning, ML): 机器学习是让机器具备从数据中学习的能力，目标是找到输入与输出之间的复杂函数关系。机器学习可以应用于多种任务，比如语音识别、图像识别和时间序列预测等。
深度学习 (Deep Learning, DL): 深度学习是机器学习的一个子领域，利用多层神经网络来学习数据的复杂特征，常用于处理大规模数据和复杂任务。
标量 (Scalar) ：表示仅具有大小而没有方向的量。在机器学习中，标量通常指单一的数值，而不涉及向量或矩阵那样的多维数据。
回归 (Regression): 机器学习中的回归任务是预测连续的数值(标量)输出，换句话说，机器从数据中找出预测函数的过程就是回归。
分类 (Classification): 分类任务是指将输入数据分配到预定义的类别中。分类任务可以有两个或多个类别。
结构化学习 (Structured Learning): 结构化学习是指机器学习模型不仅输出一个数值或类别，还可以生成一个结构化的对象，如生成文本、图片等。
特征 (Feature): 特征是用于描述输入数据的属性或变量。例如，在流量预测中，昨日的访问量即是特征。
模型 (Model): 模型通常表示一个未知的函数，其中包含需要通过数据进行学习的未知参数。模型的最终目标是确定这些函数的参数并且使得函数所预测的结果尽可能接近真实值。
权重 (Weight): 权重是模型中的参数，用于调整输入特征对输出结果的影响。它是通过训练过程学习到的。
偏置 (Bias): 偏置是模型中的另一个参数，它可以帮助调整模型的输出，使其不完全依赖于输入特征，因此可以增加模型的灵活性。
损失函数 (Loss Function): 损失函数用于评估模型预测结果与真实结果之间的差距。常见的损失函数包括平均绝对误差 (Mean Absolute Error, MAE)、均方误差 (Mean Squared Error, MSE)和交叉熵 (Cross Entropy) 等。损失函数是人为定义的，因此损失函数曲线可以是任何形状。
梯度下降 (Gradient Descent): 梯度下降是一种优化算法，用于通过迭代调整模型参数，使损失函数的值达到最小。它是机器学习训练模型中的常用迭代方法。
超参数 (Hyperparameter): 超参数是在模型训练前设定的参数，不通过数据学习得到。比如学习率、训练次数等。
学习率 (Learning Rate): 学习率即是梯度下降算法中的一个超参数，决定了每次参数更新的步伐大小。学习率过大或过小都会影响模型的收敛效果。
局部最小值 (Local Minima): 在优化过程中，损失函数可能会陷入局部最小值，而非全局最小值。这是梯度下降等优化算法可能面临的问题。
全局最小值 (Global Minima): 全局最小值是损失函数在整个参数空间中的最小值。找到全局最小值意味着找到最优的模型参数。

二、机器学习的过程

1.定义问题

首先，我们应该根据现实问题来确定机器学习的任务。在我的理解中，回归关心的是解决预测连续数值的问题，而分类解决的是离散数值的问题。比如，我们根据以往的天气数据来预测未来的降水量是多少就是一个回归问题，因为未来下多少降水量都是有可能的，数值可以是连续的；如果我们想判断水有没有沸腾就是一个分类问题，因为只有两种可能性，沸腾(True=1)和没有沸腾(False=0)，数值是离散的，两者除外没有其他情况。如果想生成某个对象且对象具有结构化特征，就是结构化学习，例如生成一篇日记。