《神经网络与深度学习》邱希鹏学习笔记(3)

最新推荐文章于 2024-06-12 09:07:04 发布

第89号

最新推荐文章于 2024-06-12 09:07:04 发布

阅读量1.4k

点赞数

分类专栏：神经网络与深度学习学习笔记文章标签：机器学习人工智能

本文链接：https://blog.csdn.net/qq_37952933/article/details/107572989

版权

本文是《神经网络与深度学习》的学习笔记，主要介绍了机器学习的基本概念，以线性回归为例阐述了模型的构建过程，并深入探讨了偏差-方差分解，解释了在模型选择中如何平衡拟合能力和复杂度。

摘要由CSDN通过智能技术生成

《神经网络与深度学习》邱希鹏学习笔记（3）

完成进度
第二章机器学习概述

完成进度

第二章机器学习概述

第二章首先介绍机器学习的基本概念和基本要素，并较为详细地描述一个机器学习的例子------线性回归

机器学习 (Machine Learning , ML) 通俗地讲，就是让计算机从数据中进行自动学习，得到某种知识/规律。

事实上，作为一门学科，机器学习通常指一类问题以及解决这类问题的方法，即如何从观测数据/样本中寻找规律，并利用学习到的规律/模型对未知或无法观测的数据进行预测。

机器学习在早期的工程领域被称作模式识别 (Pattern Recognition) ，但模式识别更偏向于具体的应用任务_{光学字符识别} _语音识别 _人脸识别。这些任务的特色是，人类自身很容易完成，但背后的原因未知，因此也很难人工设计出一个计算机程序来完成这些任务。

机器学习可以直接从有标注的样本上学习其中的规律，并完成各种识别任务，并最终取代模式识别，成为这一类问题及解决方法的总称。

线性回归

线性回归 (Linear Regression) 是机器学习和统计学中最基础和最广泛应用的模型，是一种对自变量和因变量之间关系进行建模的回归分析。

自变量数量为1时称为简单回归，自变量数量大于1时称为多元回归。

从机器学习的角度来看，自变量就是样本的特征向量 $\pmb{x} \in \mathbb{R}^D$ (每一维对应一个自变量)，因变量是标签 $y$ 。

假设空间是一组参数化的线性参数

$f(\pmb{x};\pmb{w},b) = \pmb{w}^T\pmb{x}+b,$

其中权重 $\pmb{w} \in \mathbb{R}^D$ 都是可学习的参数，函数 $f(\pmb{x};\pmb{w},b) \in \mathbb{R}$ 也称为线性模型。

简单起见，公式可整理为

$f(\pmb{x};\hat{\pmb{w}}) = \hat{\pmb{w}}^T\hat{\pmb{x}}$

其中， $\hat{\pmb{w}}$ 和 $\hat{\pmb{x}}$ 分别称为增广权重向量和增广特征向量。

$\hat{\pmb{x}}=\pmb{x}\bigoplus1\triangleq\begin{bmatrix} \\\\\pmb{x}\\\\\\1 \end{bmatrix} =\begin{bmatrix} x_1\\.\\.\\.\\x_D\\1 \end{bmatrix}$
$\hat{\pmb{w}}=\pmb{w}\bigoplus b \triangleq\begin{bmatrix} \\\\\pmb{x}\\\\\\1 \end{bmatrix} =\begin{bmatrix} w_1\\.\\.\\.\\w_D\\b \end{bmatrix}$

其中 $\bigoplus$ 定义为两个向量的拼接操作。

下文直接以 $\pmb{w}$ 和 $\pmb{x}$ 分别表示增广权重向量和增广特征向量，线性模型简化为 $f(\pmb{x};\pmb{w})=\pmb{w}^T\pmb{x}$ 。

参数学习

给定一组包含 $N$ 个训练样本的训练集 $\mathcal{D}=\{(\pmb{x}^{(n)},y^{(n)})\}^N_{n=1}$ ，希望学习一个最优的线性回归的模型参数 $\pmb{w}$ 。

介绍四种参数估计方法。

经验风险最小化

首先，由于线性回归为回归问题，损失函数使用平方损失函数。

根据经验最小化准则，训练集 $\mathcal{D}$ 上的经验风险定义为
$\begin{aligned} \mathcal{R}(\pmb{w}) &= \sum^N_{n=1}\mathcal{L}(y^{(n)},f(\pmb{x}^{(n)};\pmb{w}))\\ &= \frac{1}{2}\sum^N _{n=1}(y^{(n)}-\pmb{w}^T\pmb{x}^{(n)})^2\\ &= \frac{1}{2}||\pmb{y}-\pmb{X}^T\pmb{w}||^2,\end{aligned}$
首先，简化起见，省略了 $\frac{1}{N}$ 。

其中， $\pmb{y}=[y^{(1)},\dots,y^{(N)}]^T \in \mathbb{R}^N$ 是由所有样本的真实标签组成的列向量，而 $\pmb{X} \in \mathbb{R}^{(D+1)\times N}$ 是由所有样本的输入特征 $\pmb{x}^{(n)},\dots,\pmb{x}^{(n)}$ 组成的矩阵：
$X=\begin{bmatrix}x^{(1)}_1 & x^{(2)}_1& \cdots & x^{(N)}_1 \\\vdots & \vdots & \ddots & \vdots \\ x^{(1)}_D& x^{(2)}_D& \dots & x^{(N)}_D\\ 1& 1& \dots & 1\\ \end{bmatrix}$
风险函数 $\mathcal{R}(\pmb{w})$ 是关于 $\pmb{w}$ 的凸函数，其对 $\pmb{w}$ 的偏导数为：
$\begin{aligned} \frac{\partial\mathcal{R}(\pmb{w})}{\partial\pmb{w}} &=\frac{1}{2}\frac{\partial||\pmb{y}-\pmb{X}^T \pmb{w}||^2}{\partial\pmb{w}}\\ &=-\pmb{X}(\pmb{y}-\pmb{X}^T\pmb{w}), \end{aligned}$

最低0.47元/天解锁文章

第89号

关注

0
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
《神经网络与深度学习》邱希鹏学习笔记(3)

《神经网络与深度学习》邱希鹏学习笔记（3）完成进度第二章机器学习概述线性回归参数学习偏差-完成进度 … 第二章 (1) 第二章(2) …第二章机器学习概述第二章首先介绍机器学习的基本概念和基本要素，并较为详细地描述一个机器学习的例子------线性回归机器学习 (Machine Learning , ML) 通俗地讲，就是让计算机从数据中进行自动学习，得到某种知识/规律。事实上，作为一门学科，机器学习通常指一类问题以及解决这类问题的方法，即如何从观测数据/样本中寻找规律，并
复制链接

扫一扫