Datawhale X 李宏毅苹果书 AI夏令营 TASK1笔记

最新推荐文章于 2024-08-27 23:58:25 发布

昔___

最新推荐文章于 2024-08-27 23:58:25 发布

阅读量165

点赞数 2

文章标签：人工智能笔记

本文链接：https://blog.csdn.net/2301_77648160/article/details/141614745

版权

机器学习是一种人工智能的技术，它使计算机能够通过数据和经验自动学习和改进，而不需要明确的编程指令。简而言之，机器学习是让计算机通过分析和处理大量数据，识别模式，做出预测或决策的过程。

机器学习的核心概念包括：

1. 模型训练：使用已有的数据来训练一个模型，使其能够识别数据中的模式或规律。
2. 算法：用于训练模型的数学和统计方法。例如，回归分析、决策树、神经网络等。
3. 特征：数据中用来进行预测或分类的信息。
4. 预测和分类：训练后的模型可以用来对新数据进行预测（如预测房价）或分类（如识别图片中的物体）。

机器学习可以应用于各种领域，如自然语言处理、图像识别、推荐系统、金融预测等。

几个重要概念：

当然可以，我来用更简单的语言解释一下这些概念：

1. 标量 (Scalar): 标量就是只有一个数值的量，没有方向。例如，温度、年龄等，它们都只是单一的数值，没有方向性。

2. 回归 (Regression): 回归是在机器学习中用来预测一个连续数值的过程。比如，你可以用回归来预测明天的温度或一个房子的价格，这些都是具体的数值。

3. 分类 (Classification): 分类是把数据分到不同的类别中。比如，你可以把电子邮件分成“垃圾邮件”和“正常邮件”两类，或者把图片分类为“猫”或“狗”。

4. 结构化学习 (Structured Learning): 结构化学习处理那些有复杂结构的数据，比如一句话中的每个词之间的关系，或者一个社交网络中的用户之间的连接。它帮助模型理解数据的整体结构，从而更好地进行预测。

5. 特征 (Feature): 特征是用来描述数据的属性。例如，在预测流量时，昨天的访问量就是一个特征，因为它能影响今天的访问量预测。

6. 模型 (Model): 模型是一个数学公式或函数，它通过学习数据来预测结果。模型里有很多参数，这些参数需要通过数据来调整，以便模型能准确地进行预测。

7. 权重 (Weight): 权重是模型中用来衡量输入特征重要性的参数。通过训练，模型会调整这些权重，以便更好地预测结果。

8. 偏置 (Bias): 偏置是模型中的另一个参数，它帮助调整预测结果，使模型更加灵活，不完全依赖于输入特征。

9. 损失函数 (Loss Function): 损失函数用来衡量模型的预测结果和真实结果之间的差距。它告诉我们模型的表现如何，比如通过计算平均绝对误差或均方误差来评估。

10. 梯度下降 (Gradient Descent): 梯度下降是一种优化算法，它通过逐步调整模型参数来最小化损失函数的值。简单来说，就是在不断调整中找到使损失函数最小的参数。

11. 超参数 (Hyperparameter): 超参数是在模型训练前设定的参数，比如学习率或训练次数，这些参数不能通过数据来学习得到，而是需要在训练前手动设置。

12. 学习率 (Learning Rate) :学习率是梯度下降中控制每次调整步伐大小的参数。学习率合适的话，模型能更快地收敛，但如果学习率太大或太小，可能会导致训练效果不佳。

13. 局部最小值 (Local Minima): 在优化过程中，损失函数可能会找到一个局部最小值，即在某个区域内的最小值，但这不是整个参数空间中的最小值。这个问题可能会让模型停留在一个不够优的状态。

14. 全局最小值 (Global Minima): 全局最小值是损失函数在整个参数空间中的最小值。找到全局最小值意味着找到了最优的模型参数，模型的预测效果最佳。

机器学习的运作过程

机器学习的核心在于建立模型、定义损失函数和优化参数，以实现准确的预测。以下是一个简单的机器学习运作过程的示例：

1. 模型建立

假设我们要预测一个电商平台在未来一天的总销售额。我们可以建立一个线性回归模型来进行预测，其形式为：
\[ y = b + w \times x_1 \]

其中：
- \( y \) 是目标变量，即需要预测的销售额；
- \( x_1 \) 是已知特征，例如前一天的销售额；
- \( b \) 和 \( w \) 是未知的模型参数，需要通过数据训练来确定。

2. 损失函数定义

损失函数用于衡量模型预测结果与实际结果之间的差距。常见的损失函数包括平均绝对误差（MAE）和均方误差（MSE）。例如，对于一天的预测误差，可以计算为：
\[ e = | y - \hat{y} | \]

其中，\( \hat{y} \) 是模型的预测值。损失函数的目的是通过优化模型参数 \( b \) 和 \( w \)，使得整体预测误差最小化。

3. 参数优化

通过梯度下降法（Gradient Descent），可以不断调整参数 \( b \) 和 \( w \) 以最小化损失函数值。梯度下降法的步骤如下：
1. 计算损失函数对参数的梯度，即损失函数相对于 \( b \) 和 \( w \) 的导数。
2. 沿着梯度的反方向调整参数，以逐步逼近最优解。

梯度下降法的核心在于更新参数时使用的学习率（步长），它决定了每次更新的幅度。通过多次迭代，参数会逐渐趋向于使损失函数值最小的最优解。

在机器学习中，选择合适的模型、定义有效的损失函数以及采用高效的优化方法来确定最佳参数，是实现高精度预测的关键。在实际应用中，模型的选择、特征工程以及超参数调优都会显著影响模型的表现。

昔___

关注

2
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
Datawhale X 李宏毅苹果书 AI夏令营 TASK1笔记

4. 结构化学习 (Structured Learning): 结构化学习处理那些有复杂结构的数据，比如一句话中的每个词之间的关系，或者一个社交网络中的用户之间的连接。13. 局部最小值 (Local Minima): 在优化过程中，损失函数可能会找到一个局部最小值，即在某个区域内的最小值，但这不是整个参数空间中的最小值。在机器学习中，选择合适的模型、定义有效的损失函数以及采用高效的优化方法来确定最佳参数，是实现高精度预测的关键。例如，在预测流量时，昨天的访问量就是一个特征，因为它能影响今天的访问量预测。
复制链接

扫一扫