四十、【人工智能】【机器学习】- 梯度下降（Gradient Descent Algorithms）算法模型

暴躁的大熊

于 2024-08-19 11:12:31 发布

阅读量605

点赞数 23

文章标签：人工智能机器学习算法

本文链接：https://blog.csdn.net/xgq8217/article/details/141252077

版权

系列文章目录

第一章【机器学习】初识机器学习

第二章【机器学习】【监督学习】- 逻辑回归算法 (Logistic Regression)

第三章【机器学习】【监督学习】- 支持向量机 (SVM)

第四章【机器学习】【监督学习】- K-近邻算法 (K-NN)

第五章【机器学习】【监督学习】- 决策树 (Decision Trees)

第六章【机器学习】【监督学习】- 梯度提升机 (Gradient Boosting Machine, GBM)

第七章【机器学习】【监督学习】-神经网络 (Neural Networks)

第八章【机器学习】【监督学习】-卷积神经网络 (CNN)

第九章【机器学习】【监督学习】-循环神经网络 (RNN)

第十章【机器学习】【监督学习】-线性回归

第十一章【机器学习】【监督学习】-局部加权线性回归 (Locally Weighted Linear Regression, LWLR)

第十二章【机器学习】【监督学习】- 岭回归 (Ridge Regression)

十三、【机器学习】【监督学习】- Lasso回归 (Least Absolute Shrinkage and Selection Operator)

十四、【机器学习】【监督学习】- 弹性网回归 (Elastic Net Regression)

十五、【机器学习】【监督学习】- 神经网络回归

十六、【机器学习】【监督学习】- 支持向量回归 (SVR)

十七、【机器学习】【非监督学习】- K-均值 (K-Means)

十八、【机器学习】【非监督学习】- DBSCAN (Density-Based Spatial Clustering of Applications with Noise)十九、【机器学习】【非监督学习】- 层次聚类 (Hierarchical Clustering)二十、【机器学习】【非监督学习】- 均值漂移 (Mean Shift)

二十一、【机器学习】【非监督学习】- 谱聚类 (Spectral Clustering)

（三）、监督学习分类算法（Classification）

二、梯度下降算法（Gradient Descent Algorithms）

（一）、定义

（二）、基本概念

（三）训练过程

标准梯度下降 (Batch Gradient Descent)

随机梯度下降 (Stochastic Gradient Descent, SGD)

一、基本定义

（一）、监督学习

监督学习（Supervised Learning）是机器学习中的一种主要方法，其核心思想是通过已知的输入-输出对（即带有标签的数据集）来训练模型，从而使模型能够泛化到未见的新数据上，做出正确的预测或分类。在监督学习过程中，算法“学习”的依据是这些已标记的例子，目标是找到输入特征与预期输出之间的映射关系。

（二）、监督学习的基本流程

数据收集：获取包含输入特征和对应正确输出标签的训练数据集。
        数据预处理：清洗数据，处理缺失值，特征选择与转换，标准化或归一化数据等，以便于模型学习。
        模型选择：选择合适的算法，如决策树、支持向量机、神经网络等。
        训练：使用训练数据集调整模型参数，最小化预测输出与实际标签之间的差距（损失函数）。
        验证与调优：使用验证集评估模型性能，调整超参数以优化模型。
        测试：最后使用独立的测试集评估模型的泛化能力，确保模型不仅在训练数据上表现良好，也能在未见过的新数据上做出准确预测。

（三）、监督学习分类算法（Classification）

定义：分类任务的目标是学习一个模型，该模型能够将输入数据分配到预定义的几个类别中的一个。这是一个监督学习问题，需要有一组已经标记好类别的训练数据，模型会根据这些数据学习如何区分不同类别。
例子：垃圾邮件检测（垃圾邮件 vs. 非垃圾邮件）、图像识别（猫 vs. 狗）。

二、梯度下降算法（Gradient Descent Algorithms）

（一）、定义

Gradient Descent（梯度下降）算法是一种迭代优化算法，用于求解最小化问题，特别是在机器学习和深度学习领域中寻找损失函数的最小值。其基本思想是沿着目标函数梯度的反方向（即函数下降最快的方向）更新参数，以逐步逼近函数的最小值点。梯度下降算法可以应用于各种类型的函数，但最常用于求解无约束优化问题。

（二）、基本概念

目标函数: 梯度下降的目标函数通常是损失函数，它衡量模型预测与实际值之间的差距。
梯度: 梯度是目标函数在某一点的导数或偏导数，表示函数在该点的斜率或方向导数，指向函数增长最快的方向。
学习率: 学习率（γ 或 η）是更新参数时的步长，控制着每次迭代中参数更新的幅度。
参数更新公式: 梯度下降更新参数的公式为，其中 xt 是当前参数，γ 是学习率，∇f(xt) 是目标函数在当前参数处的梯度。

（三）训练过程

梯度下降算法的训练过程是机器学习和深度学习中至关重要的环节，其目标是通过迭代更新参数来最小化损失函数。下面是对训练过程的详细分解，包括不同的梯度下降变种以及它们的特点：