机器学习快速入门第一阶段：基础名词

Amorwest

已于 2024-04-01 14:30:30 修改

阅读量844

点赞数 33

分类专栏：吴恩达机器学习入门（快速版）小白的快速入门机器学习文章标签：人工智能机器学习

于 2024-04-01 14:10:53 首次发布

本文链接：https://blog.csdn.net/wstwxl/article/details/137230085

版权

吴恩达机器学习入门（快速版）同时被 2 个专栏收录

3 篇文章 1 订阅

订阅专栏

小白的快速入门机器学习

3 篇文章 0 订阅

订阅专栏

本文介绍了机器学习中的监督学习（含线性回归、逻辑回归等算法）和非监督学习（如聚类分析），强调了代价函数、梯度下降和特征工程的重要性。通过实例展示了如何用这些概念解决房价预测和分类问题，以及如何处理过拟合问题。

摘要由CSDN通过智能技术生成

欢迎大家步入机器学习的大门，这是一门很有意思的课程，希望大家从了解到喜欢

最先了解的两个内容：

监督学习&非监督学习

监督学习和非监督学习是机器学习中两个非常重要的范式，它们各有特点和适用场景。

监督学习（Supervised Learning）

监督学习是一种机器学习方法，它在训练过程中利用已知的输入输出对（即带有标签的训练数据）来训练模型。训练完成后，这个模型将能够对新的、未见过的数据进行有效的预测或分类。

特点：

数据标签：每个训练样本都有一个已知的标签或结果，如图片的标签可能是“猫”或“狗”。
目标导向：训练过程中明确目标，即最小化模型的预测值和真实值之间的差异。
广泛应用：监督学习应用广泛，包括图像和语音识别、邮件过滤、预测分析等。

常见算法：

线性回归
逻辑回归
支持向量机（SVM）
决策树和随机森林
神经网络

非监督学习（Unsupervised Learning）

非监督学习不同于监督学习，它不依赖于标注好的训练数据，而是直接对原始数据进行建模。非监督学习的目标是发现数据中的内在结构和模式。

特点：

无需数据标签：训练数据没有标签，也就是说，我们不知道每个样本的结果或分类。
发现隐藏模式：非监督学习的目标是发现数据中的隐藏结构或模式，如将客户分为不同的群体。
灵活性高：在没有明确任务目标的情况下，非监督学习可以探索数据，发现其中可能未知的有趣模式。

常见算法：

聚类分析，如K-均值（K-means）算法
主成分分析（PCA）
自组织映射（SOM）
层次聚类分析（Hierarchical clustering）

二者比较：

数据要求：监督学习需要大量的标注数据，而非监督学习不需要。
目标不同：监督学习旨在预测或分类，非监督学习旨在发现数据的内在结构。
应用场景：监督学习适用于明确任务的情况，如分类或回归任务；非监督学习适用于数据探索，如用户细分或特征提取。

上文帮助大家更好地理解监督学习和非监督学习的区别和应用。

我们的第二项内容帮助大家了解机器学习入门的其他基础名词：

入门第一阶段名词表：

线性回归模型	实现梯度下降	向量化	多项式回归	梯度下降实现
代价函数	梯度下降的直观理解	多元线性回归的梯度下降法	Motivations	过拟合的问题
代价函数的直观理解	学习率	特征缩放	逻辑(logistic)回归	解决过拟合
可视化代价函数	线性回归中的梯度下降	检查梯度下降是否收敛	决策边界	正则化代价函数
可视化的例子	运行梯度下降	学习率的选择	逻辑回归的代价函数	正则化线性回归
梯度下降	多类特征	特征工程	逻辑回归的简化版代价函数	正则化logistic回归

为了帮助大家更好地理解这些概念，我将以线性回归模型为起点，通过脉络连接这些内容，并对它们进行讲解。

1. 线性回归模型（Linear Regression Model）

线性回归是一种预测数值型数据的监督学习算法。它试图建立自变量(X)和因变量(Y)之间的线性关系，即 Y = mX + b，其中m是斜率，b是截距。

2. 代价函数（Cost Function）

代价函数（也称为损失函数）量化了模型预测值与实际值之间的差异。在线性回归中，常用的代价函数是均方误差（MSE）。

3. 代价函数的直观理解 & 可视化

代价函数的值越小，表示模型的预测值与实际值越接近。可视化代价函数通常会展示为一个二维或三维图形，显示不同参数值下代价函数的变化，帮助我们直观地理解如何通过调整模型参数来最小化误差。

4. 梯度下降（Gradient Descent）

梯度下降是一种优化算法，用于最小化代价函数。它通过迭代地调整参数，沿着代价函数的梯度下降的方向，逐步接近最小值。

5. 实现梯度下降 & 梯度下降的直观理解

在实现梯度下降时，关键在于计算代价函数关于每个参数的偏导数，以确定调整参数的方向和幅度。直观上，可以将其想象为一个球沿着山坡滚下来，最终稳定在最低点。

6. 学习率（Learning Rate）

学习率决定了在梯度下降过程中参数更新的步长。如果学习率过大，可能会导致超过最低点；如果过小，则收敛速度会非常慢。

7. 线性回归中的梯度下降

在线性回归中，梯度下降用于找到最佳的斜率和截距，以最小化代价函数。

8. 多元线性回归（Multivariate Linear Regression）

当有多个自变量时，线性回归模型可以扩展为多元线性回归。模型形式变为 Y = b + m1X1 + m2X2 + ... + mnXn。

9. 向量化（Vectorization） & 特征缩放（Feature Scaling）

向量化是一种编程技术，可以通过矩阵运算同时处理多个特征，从而提高计算效率。特征缩放如标准化或归一化，可以加快梯度下降的收敛速度。

10. 检查梯度下降是否收敛 & 学习率的选择

通过绘制代价函数值随迭代次数的变化曲线，可以检查梯度下降是否收敛。合适的学习率选择是一个试验和调整的过程。

11. 特征工程（Feature Engineering）

特征工程涉及到选择、修改或创建新的特征以提高模型的性能。多项式回归是特征工程的一个例子，它通过增加自变量的高次项来扩展模型。

12. 逻辑回归（Logistic Regression）

逻辑回归是一种用于二分类问题的监督学习算法。它

通过Sigmoid函数将线性回归的输出映射到0和1之间，以预测概率。

13. 决策边界（Decision Boundary） & 逻辑回归的代价函数

决策边界是逻辑回归中用来分隔不同类别的直线或曲线。逻辑回归的代价函数与线性回归不同，通常使用交叉熵损失函数。

14. 过拟合（Overfitting） & 解决方案

过拟合发生在模型过度复杂，以至于它在训练数据上表现得很好，但在新的、未见过的数据上表现差。解决过拟合的方法包括减少特征数量、获取更多数据或正则化。

15. 正则化（Regularization）

正则化是一种用于减少过拟合的技术，通过向代价函数中添加一个正则化项来惩罚过大的模型参数。正则化适用于线性回归和逻辑回归。

通过这个脉络，大家可以看到从基础的线性回归模型出发，如何通过代价函数和梯度下降这两个关键概念，逐步深入到模型优化、特征处理、到处理分类问题的逻辑回归，以及如何应对过拟合等高级问题。每个部分都是建立在前面内容的基础上，形成了一个连贯的学习路径。

好的，通过上面的学习，相信大家能够对机器学习的基础名词已经有所了解，现在我们通过两个小问题加深对于基础名词的了解！

问题1 ：

目标：根据一些特征（如房屋大小、位置、房间数量等）来预测房价。

我们通过十步走，将上面的名字放在问题之中

1. 数据收集：

首先，我们需要收集相关数据，这些数据包括房屋的特征和对应的价格。

2. 数据预处理：

这一步可能需要进行特征工程，比如选择相关的特征、创建新的特征（例如，从地理位置数据中提取特定区域）。

3. 选择模型：

假定我们选择线性回归模型来预测房价，因为我们预测的是一个连续的数值。

4. 定义代价函数：

我们需要一个代价函数来量化模型预测房价与实际房价之间的差异。在线性回归中，通常使用均方误差（MSE）作为代价函数。

5. 优化模型 - 梯度下降：

为了最小化代价函数，我们使用梯度下降算法来优化线性回归模型的参数。这个过程中，梯度下降的直观理解是我们在代价函数的曲面上寻找最低点。

6. 学习率选择：

在执行梯度下降时，选择合适的学习率至关重要，因为它决定了每一步我们向最低点迈进的距离。

7. 特征缩放：

如果我们的特征量纲差异很大，可能需要进行特征缩放，如归一化或标准化，以加快梯度下降的收敛速度。

8. 实施梯度下降：

使用编程实现梯度下降算法，不断更新模型参数直至代价函数收敛到最小值。

9. 模型评估：

通过测试集评估模型的性能，查看模型预测房价与实际房价之间的差异。

10. 过拟合检查与解决：

如果模型在训练集上表现很好，但在测试集上表现不佳，可能存在过拟合问题。此时，可以考虑使用正则化技术来减少过拟合。

通过这个流程，大家可以看到如何将这些概念串联起来解决一个实际问题。每一个步骤都有其特定的目的和作用，共同协作以建立、优化并评估预测模型。

问题2：

连续特征（如面积、楼龄）和分类特征（是否高价位）：多元线性回归来处理连续特征；逻辑回归来处理分类预测

涉及到向量化、多项式回归以及决策边界

目标：基于一些特征（如面积、卧室数量、楼龄等）预测一套房子是否属于高价位区间。

1. 数据收集与预处理

首先，我们需要收集包含房屋特征和价格区间的数据。预处理阶段可能包括清理数据、处理缺失值、特征选择等。

2. 特征工程

多元线性回归：考虑到房价可能受到多个因素的影响，我们可以使用多元线性回归模型来捕捉这些因素和房价之间的线性关系。
多项式回归：如果某些特征与房价之间的关系更可能是非线性的，我们可以使用多项式回归来捕捉这种复杂的关系，如将面积的平方项作为一个新特征加入模型。

3. 向量化

为了提高计算效率，我们可以使用向量化的方式来表达和处理数据。这意味着将特征和参数表示为向量，使用矩阵运算来同时计算所有样本的预测值和梯度。

4. 逻辑回归

由于我们的目标是分类（是否高价位），因此我们需要使用逻辑回归模型。逻辑回归模型通过Sigmoid函数将线性回归的结果映射到0和1之间，表示概率。

5. 决策边界 & 逻辑回归的代价函数

决策边界：在逻辑回归中，决策边界是用来区分不同分类的界线。模型训练完成后，我们可以通过设置阈值（通常是0.5）来确定这个界线，从而将预测概率转换为类别标签。
代价函数：逻辑回归使用的代价函数不同于线性回归。为了适应逻辑回归模型的输出特性（概率），通常使用交叉熵损失函数来量化模型的预测值与实际标签之间的差异。