深度学习 --- 应用数学和机器学习基础(线性代数)

1、线性相关和生成子空间

对于线性方程组:Ax=b,如果逆矩阵 存在,那么对每一个向量b恰好存在一个解。但是,对于方程组而言,对于向量b的某些值,有可能不存在解或者存在无限多解。

为了分析方程有多少个解,我们可以将A的列向量看作从原点出发的不同方向,确定有多少种方法可以到达向量b。在这个观点下,向量x中的每个元素表示我们应该沿着这些方向走多远,即xi表示我们需要沿着第i个向量的方向走多远。一般,这种操作称为线性组合。

一组向量的生成子空间是原始向量线性组合后所能抵达的点的集合。

确定Ax=b是否有解,相当于确定向量b是否在A列向量的生成子空间中。这个特殊的生成子空间被称为A的列空间或者A的值域。

为了使方程Ax=b对于任意向量 都存在解,我们要求A的列空间构成整个 。如果 中的某个点不在A的列空间中,那么该点对应的b会使得该方程没有解。矩阵A的列空间是整个 的要求,意味着A至少有m列,即n≥m。否则A的列空间维数会小于m。

 

2、范数

范数可以通过点积 计算

当机器学习问题中零和非零元素之间的差异非常重要时,通常会使用 范数。每当x中某个元素从0增加ε,对应的范数也会增加ε。

有时会统计向量中非零元素的个数来衡量向量的大小,有些作者称为 范数,在数学意义上不对,因为对向量缩放α倍不会改变该向量非零元素的数目。

范数,最大范数,表示向量中具有最大幅值的元素的绝对值:

衡量矩阵大小,用Frobenius范数,即

 

3、特殊类型的矩阵和向量

对角矩阵diag(v)x,只需将x中的每个元素 放大 倍。

对角矩阵diag(v)的逆矩阵存在,当且仅当对角元素都是非零值,此时

非方阵的对角矩阵没有逆矩阵

对于一个长方形对角矩阵D而言,乘法Dx会涉及x中每个元素的缩放,如果D是瘦长型矩阵,那么在缩放后的末尾添加一些零,如果D是宽胖型矩阵,那么在缩放后去掉一些元素。

 

正交矩阵是指行向量和列向量是分别标准正交的方阵,即 ,这意味着 。正交矩阵的行向量不仅是正交的,而且是标准正交的。对于行向量或列向量互相正交但不是标准正交的矩阵,没有对应的专有术语

 

4、特征分解

非奇异矩阵A,n×n:Av = λv

每个实对称矩阵都可以分解成是特征向量和实特征值: ,Q是A的特征向量组成的正交矩阵。

实对称矩阵的特征分解可以用于优化二次方程 ,其中限制 。当x等于A的某个特征向量时,f将返回对应的特征值。在限制条件下,函数f的最大值是最大特征值,最小值是最小特征值。

半正定矩阵保证 ,正定矩阵保证

 

5、奇异值分解

每个实数矩阵都有一个奇异值分解,但不一定都有特征分解,如非方阵的矩阵没有特征分解

A是m×n矩阵,

A的奇异值:的特征值的平方根

的特征向量

D的对角线元素是A的奇异值

奇异值分解:

 

6、Moore-Penrose 伪逆

矩阵A的伪逆: ,其中对角矩阵D的伪逆是其非零元素取到数之后再转置得到的。

当矩阵A的列数多于行数时,使用伪逆求解线性方程是众多可能解法中的一种。特别地, 是方程所有可行解中欧几里得范数 最小的一个。

当矩阵A的行数多于列数时,可能没有解。在这种情况下,通过伪逆得到的x使得Ax和y的欧几里得距离 最小。

 

7、迹运算

优化问题  ,可通过特征分解求解,最优的d是 最大特征值对应的特征向量。(二次型,实对称矩阵,约束条件,最大特征向量对应二次型最大值)

 

8、行列式

行列式,det(A)是将一个方阵A映射到实数的函数。行列式等于矩阵特征值的乘积。行列式的绝对值可以用来衡量矩阵参与矩阵乘法后空间扩大或者缩小了多少。如果行列式是0,那么空间至少沿着某一维完全收缩了,使其失去了所有的体积;如果行列式是1,那么这个转换保持空间体积不变。

 

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
以下是机器学习深度学习、统计学、线性代数和概率论等基础概念的简要介绍: 1. 机器学习(Machine Learning):机器学习是一种人工智能的分支,通过使用算法和统计模型,使计算机系统能够自动从数据中学习和改进,并且可以进行预测、分类、聚类等任务,而无需显式地进行编程。 2. 深度学习(Deep Learning):深度学习机器学习的一种特殊方法,它基于人工神经网络的概念,通过多层次的神经网络结构进行训练和学习。深度学习在处理大规模数据和复杂任务时具有很强的表达能力和学习能力。 3. 统计学(Statistics):统计学是一门研究收集、分析、解释和推断数据的学科。它涉及到数据收集的方法、数据可视化、概率模型、假设检验和推断等内容,用于从数据中获取有关现象或群体的信息。 4. 线性代数(Linear Algebra):线性代数是研究向量空间和线性变换的数学分支。它涉及到向量、矩阵、线性方程组、特征值和特征向量等概念,是机器学习深度学习中使用的重要数学工具。 5. 概率论(Probability Theory):概率论是研究随机事件和概率的数学分支。它涉及到随机变量、概率分布、条件概率、贝叶斯推断等概念,用于描述和计算事件发生的可能性。 这些基础概念在机器学习深度学习中都起着重要的作用,对于理解算法原理、模型训练和评估等方面都非常重要。建议您深入学习这些概念,并在实践中应用它们,以便更好地理解和应用机器学习深度学习技术。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值