【机器学习01】基本概念

一碗姜汤

已于 2024-05-21 13:57:21 修改

阅读量975

点赞数 9

分类专栏：机器学习文章标签：机器学习算法人工智能

于 2024-05-21 13:34:31 首次发布

本文链接：https://blog.csdn.net/weixin_55252589/article/details/139089994

版权

10 篇文章 2 订阅

订阅专栏

机器学习是计算机科学的一个分支，通过算法和统计模型使计算机系统能够在没有明确指令的情况下执行特定任务。机器学习的核心思想是从数据中学习规律，并基于这些规律进行预测或决策。以下是机器学习的一些基本数学定义和概念：

数据集是机器学习模型进行训练和测试的数据集合。假设一个数据集 $D$ 包含 $n$ 个样本，每个样本由一个特征向量 $\mathbf{x}_i$ 和一个目标变量 $y_i$ 组成：

$\{(\mathbf{x}_1, y_1), (\mathbf{x}_2, y_2), \ldots, (\mathbf{x}_n, y_n)\}$

其中， $\mathbf{x}_i \in \mathbb{R}^d$ ， $y_i \in \mathbb{R}$ 或 $y_i \in \{0, 1\}$ 等。

目标函数也称为损失函数或代价函数，用于衡量模型预测值与实际值之间的差异。常见的目标函数包括：

均方误差 (Mean Squared Error, MSE)：用于回归问题。
$L(\mathbf{w}) = \frac{1}{n} \sum_{i=1}^{n} (y_i - \hat{y}_i)^2$
交叉熵 (Cross-Entropy)：用于分类问题。
$L(\mathbf{w}) = - \frac{1}{n} \sum_{i=1}^{n} [y_i \log \hat{y}_i + (1 - y_i) \log (1 - \hat{y}_i)]$

机器学习模型是通过学习数据集中的规律来进行预测的函数。假设模型为 $f$ ，则对于输入特征向量 $\mathbf{x}$ ，输出预测值 $\hat{y}$ ：

$\hat{y} = f(\mathbf{x}; \mathbf{w})$

其中， $\mathbf{w}$ 为模型的参数。

学习算法用于优化模型参数 $\mathbf{w}$ ，使目标函数 $L(\mathbf{w})$ 最小化。常见的优化算法包括：

梯度下降法 (Gradient Descent)
$\mathbf{w} \leftarrow \mathbf{w} - \eta \nabla L(\mathbf{w})$
其中， $\eta$ 为学习率， $\nabla L(\mathbf{w})$ 为目标函数的梯度。

评估指标用于衡量模型的性能。常见的评估指标包括：

精度 (Accuracy)：用于分类问题。
$\text{Accuracy} = \frac{\text{Number of Correct Predictions}}{\text{Total Number of Predictions}}$
均方误差 (MSE)：用于回归问题。
$\text{MSE} = \frac{1}{n} \sum_{i=1}^{n} (y_i - \hat{y}_i)^2$

正则化用于防止模型过拟合，通过在目标函数中加入正则项来控制模型的复杂度。常见的正则化方法包括：

L2 正则化 (Ridge Regression)
$L(\mathbf{w}) = \frac{1}{n} \sum_{i=1}^{n} (y_i - \hat{y}_i)^2 + \lambda \|\mathbf{w}\|_2^2$
L1 正则化 (Lasso Regression)
$L(\mathbf{w}) = \frac{1}{n} \sum_{i=1}^{n} (y_i - \hat{y}_i)^2 + \lambda \|\mathbf{w}\|_1$