《深度学习》第二章线性代数

第二章 线性代数

目录

线性代数的表示

  • 标量(Scalars)
    单个数值:整数5、实数0.5、有理数1/3等
    用小写字母表示,如 a, n, x

  • 向量(Vectors)
    一维数组,无特别说明,即指列向量
    加粗小写,如
    x = [ x 1 x 2 . . . x n ] = ( x 1 , x 2 , . . . , x n ) T \mathbf{x}= \begin{bmatrix} x_1 \\ x_2 \\ ...\\ x_n \end{bmatrix} = \begin{pmatrix} x_1, x_2, ..., x_n \end{pmatrix}^T x=x1x2...xn=(x1,x2,...,xn)T

  • 矩阵(Matrix)
    二维数组
    大写字母表示 A m × n A_{m \times n} Am×n A ∈ R m × n A \in R^{m\times n} ARm×n
    向量可视为 m × 1 m \times 1 m×1 的矩阵

  • 张量(Tensor)
    数组的扩展

CNN中的卷积核

矩阵的转置

  • 定义:行、列坐标互换,行变列,列变行

( A T ) i , j = A j , i (A^T)_{i,j} = A_{j,i} (AT)i,j=Aj,i

如:
A 3 × 2 = [ A 1 , 1 A 1 , 2 A 2 , 1 A 2 , 2 A 3 , 1 A 3 , 2 ] 则 A 2 × 3 T = [ A 1 , 1 A 2 , 1 A 3 , 1 A 1 , 2 A 2 , 2 A 3 , 2 ] A_{3 \times 2} = \begin{bmatrix} A_{1,1} & A_{1,2} \\ A_{2,1} & A_{2,2} \\ A_{3,1} & A_{3,2} \\ \end{bmatrix} 则 \\ A^T_{2 \times 3} = \begin{bmatrix} A_{1,1} & A_{2,1} & A_{3,1} \\ A_{1,2} & A_{2,2} & A_{3,2} \\ \end{bmatrix} A3×2=A1,1A2,1A3,1A1,2A2,2A3,2A2×3T=[A1,1A1,2A2,1A2,2A3,1A3,2]

矩阵的转置有性质:
( A B ) T = B T A T (AB)^T=B^{T}A^T (AB)T=BTAT

矩阵相乘

  • 第一种理解:元素为列乘以行

有矩阵 A m × n A_{m \times n} Am×n B l × k B_{l \times k} Bl×k n = l n=l n=l A B AB AB 存在

矩阵 A A A B B B 相乘,其元素由下式计算
( A B ) i , j = ∑ k A i , k B k , j (AB)_{i,j}=\sum_k A_{i,k}B_{k,j} (AB)i,j=kAi,kBk,j

A B = [ 1 2 3 4 5 6 ] [ 1 4 2 5 3 6 ] = [ ( 1 , 2 , 3 ) ( 1 , 2 , 3 ) T ( 1 , 2 , 3 ) ( 4 , 5 , 6 ) T ( 4 , 5 , 6 ) ( 1 , 2 , 3 ) T ( 4 , 5 , 6 ) ( 4 , 5 , 6 ) T ] AB= \begin{bmatrix} 1 & 2 & 3 \\ 4 & 5 & 6 \\ \end{bmatrix} \begin{bmatrix} 1 & 4 \\ 2 & 5 \\ 3 & 6 \\ \end{bmatrix}= \begin{bmatrix} (1,2,3) (1,2,3)^T & (1,2,3) (4,5,6)^T \\ (4,5,6) (1,2,3)^T & (4,5,6) (4,5,6)^T \\ \end{bmatrix} AB=[142536]123456=[(1,2,3)(1,2,3)T(4,5,6)(1,2,3)T(1,2,3)(4,5,6)T(4,5,6)(4,5,6)T]
另一种理解:行乘以列的各矩阵相加
A B = [ 1 2 3 4 5 6 ] [ 1 4 2 5 3 6 ] = ( 1 , 4 ) ( 1 , 4 ) T + ( 2 , 5 ) ( 2 , 5 ) T + ( 3 , 6 ) ( 3 , 6 ) T = [ 1 4 4 16 ] + [ 4 10 10 25 ] + [ 9 18 18 36 ] AB= \begin{bmatrix} 1 & 2 & 3 \\ 4 & 5 & 6 \\ \end{bmatrix} \begin{bmatrix} 1 & 4 \\ 2 & 5 \\ 3 & 6 \\ \end{bmatrix}= (1,4) (1,4)^T+(2,5) (2,5)^T+(3,6) (3,6)^T \\ = \begin{bmatrix} 1 & 4 \\ 4 & 16 \end{bmatrix} + \begin{bmatrix} 4 & 10 \\10 & 25 \end{bmatrix} + \begin{bmatrix} 9 & 18 \\18 & 36 \end{bmatrix} AB=[142536]123456=(1,4)(1,4)T+(2,5)(2,5)T+(3,6)(3,6)T=[14416]+[4101025]+[9181836]

向量的线性相关性与矩阵的秩

  • 定义
    对向量组 x 1 , x 2 , . . . , x s ( s ≥ 1 ) \mathbf x_1, \mathbf x_2, ..., \mathbf x_s (s \ge 1) x1,x2,...,xs(s1) 若存在一组不全为0的数
    k 1 , . . . , k s k_1, ..., k_s k1,...,ks
    使得
    k 1 x 1 + . . . + k s x s = 0 k_1\mathbf x_1+...+k_s\mathbf x_s=0 k1x1+...+ksxs=0
    则称该向量组线性相关,反之,则线性无关
    线性无关的充要条件:其中任何一个向量不能由其余向量线性表出

  • 极大线性无关组
    对于一个向量组$\mathbf x_1, …, \mathbf x_s $,若存在一个部分组,满足:

  1. 这个部分组线性无关

  2. 如果从向量组的其余部分中任取一个添加进去,则到的新部分组都线性相关,则这个部分组称为向量组$\mathbf x_1, …, \mathbf x_s $的极大线性无关组

    向量组与它的任意一个极大线性无关组等价(等价——互可线性表出)
    不含零向量的向量组如果线性相关,则它的极大线性无关组肯定不止一个

  • 向量组的秩
    向量组的一个极大线性无关组所含的向量的个数,记为 r a n k { x 1 , . . . , x s } rank\{\mathbf x_1, ..., \mathbf x_s\} rank{x1,...,xs}

  • 矩阵的秩
    矩阵的列微量组的秩称为 A A A 的列秩, A A A 的行向量组的秩称为 A A A 的行秩
    任一矩阵的行秩等于其列秩,统称为矩阵 A A A 的秩,记作 r a n k ( A ) rank(A) rank(A)

单位矩阵与逆矩阵

  • 方阵:行数等于列数 A n × n A_{n \times n} An×n

  • 对角矩阵:对于一个方阵,对角线外的元素均为零,即为对角矩阵

  • 单位矩阵:对于一个对角矩阵,对角线上的元素均为1,即为单位矩阵,用 I n I_n In表示

  • 逆矩阵:对方阵 A n A_n An,若存在方阵 B n B_n Bn使得 A B = B A = I AB=BA=I AB=BA=I,则 A A A为可逆矩阵, B B B A A A互为逆矩阵

  • 矩阵可逆的等价条件

  1. A A A为满秩矩阵(满秩矩阵——矩阵的秩等于方阵的列数/行数)
  2. A A A的各列线性无关
  • 非满秩方阵称为奇异矩阵

向量的范数

  • 向量的大小用范数来衡量,形式上, L P L^P LP 范数定义
    ∣ ∣ x ∣ ∣ P = ( ∑ i ∣ x i ∣ p ) 1 p ||x||_P={(\sum_i |x_i|^p)} ^{\frac{1}{p}} xP=(ixip)p1
    ∣ ∣ [ 1 2 3 ] ∣ ∣ 2 = 1 2 + 2 2 + 3 2 ||\begin{bmatrix} 1 \\ 2 \\ 3 \end{bmatrix}||_2= \sqrt {1^2+2^2+3^2} 1232=12+22+32
    范数满足下列性质
  1. 非负性:若 x ≠ 0 \mathbf x \neq \mathbf 0 x=0,则 f ( x ) > 0 f(\mathbf x)>0 f(x)>0;$f(\mathbf x)=0 \Rightarrow \mathbf x = \mathbf 0 $
  2. 三角不等式(不要与凸函数性质混淆): f ( x + y ) ≤ f ( x ) + f ( y ) f(\mathbf x + \mathbf y) \le f(\mathbf x) + f(\mathbf y) f(x+y)f(x)+f(y)
  3. 齐次性: ∀ α ∈ R , f ( α x ) = ∣ α ∣ f ( x ) \forall \alpha \in \mathbb R, f(\alpha \mathbf x) = |\alpha|f(\mathbf x) αR,f(αx)=αf(x)
  • 几个常见范数
  1. L2范数 p = 2 p=2 p=2,欧里几得范数 L 2 = x T x L^2=x^Tx L2=xTx,机器学习中最常用
    推广至矩阵Frobenius norm ∣ ∣ A ∣ ∣ F = ∑ i , j A i , j 2 ||A||_F=\sqrt {\sum_{i,j} A^2_{i,j}} AF=i,jAi,j2
  2. L1范数 p = 1 p=1 p=1 L 1 = ∣ ∣ x ∣ ∣ 1 = ∑ i ∣ x i ∣ L^1=||\mathbf x||_1 = \sum_{i} |x_i| L1=x1=ixi,也较常用
  3. 最大范数 ∣ ∣ x ∣ ∣ ∞ = m a x i ∣ x i ∣ ||\mathbf x|| _\infty=max_i|x_i| x=maxixi

正则化效果
L1与L2范数
最大范数

特征值分解

定义:特征向量(eigenvector)

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
完整版:https://download.csdn.net/download/qq_27595745/89522468 【课程大纲】 1-1 什么是java 1-2 认识java语言 1-3 java平台的体系结构 1-4 java SE环境安装和配置 2-1 java程序简介 2-2 计算机中的程序 2-3 java程序 2-4 java类库组织结构和文档 2-5 java虚拟机简介 2-6 java的垃圾回收器 2-7 java上机练习 3-1 java语言基础入门 3-2 数据的分类 3-3 标识符、关键字和常量 3-4 运算符 3-5 表达式 3-6 顺序结构和选择结构 3-7 循环语句 3-8 跳转语句 3-9 MyEclipse工具介绍 3-10 java基础知识章节练习 4-1 一维数组 4-2 数组应用 4-3 多维数组 4-4 排序算法 4-5 增强for循环 4-6 数组和排序算法章节练习 5-0 抽象和封装 5-1 面向过程的设计思想 5-2 面向对象的设计思想 5-3 抽象 5-4 封装 5-5 属性 5-6 方法的定义 5-7 this关键字 5-8 javaBean 5-9 包 package 5-10 抽象和封装章节练习 6-0 继承和多态 6-1 继承 6-2 object类 6-3 多态 6-4 访问修饰符 6-5 static修饰符 6-6 final修饰符 6-7 abstract修饰符 6-8 接口 6-9 继承和多态 章节练习 7-1 面向对象的分析与设计简介 7-2 对象模型建立 7-3 类之间的关系 7-4 软件的可维护与复用设计原则 7-5 面向对象的设计与分析 章节练习 8-1 内部类与包装器 8-2 对象包装器 8-3 装箱和拆箱 8-4 练习题 9-1 常用类介绍 9-2 StringBuffer和String Builder类 9-3 Rintime类的使用 9-4 日期类简介 9-5 java程序国际化的实现 9-6 Random类和Math类 9-7 枚举 9-8 练习题 10-1 java异常处理 10-2 认识异常 10-3 使用try和catch捕获异常 10-4 使用throw和throws引发异常 10-5 finally关键字 10-6 getMessage和printStackTrace方法 10-7 异常分类 10-8 自定义异常类 10-9 练习题 11-1 Java集合框架和泛型机制 11-2 Collection接口 11-3 Set接口实现类 11-4 List接口实现类 11-5 Map接口 11-6 Collections类 11-7 泛型概述 11-8 练习题 12-1 多线程 12-2 线程的生命周期 12-3 线程的调度和优先级 12-4 线程的同步 12-5 集合类的同步问题 12-6 用Timer类调度任务 12-7 练习题 13-1 Java IO 13-2 Java IO原理 13-3 流类的结构 13-4 文件流 13-5 缓冲流 13-6 转换流 13-7 数据流 13-8 打印流 13-9 对象流 13-10 随机存取文件流 13-11 zip文件流 13-12 练习题 14-1 图形用户界面设计 14-2 事件处理机制 14-3 AWT常用组件 14-4 swing简介 14-5 可视化开发swing组件 14-6 声音的播放和处理 14-7 2D图形的绘制 14-8 练习题 15-1 反射 15-2 使用Java反射机制 15-3 反射与动态代理 15-4 练习题 16-1 Java标注 16-2 JDK内置的基本标注类型 16-3 自定义标注类型 16-4 对标注进行标注 16-5 利用反射获取标注信息 16-6 练习题 17-1 顶目实战1-单机版五子棋游戏 17-2 总体设计 17-3 代码实现 17-4 程序的运行与发布 17-5 手动生成可执行JAR文件 17-6 练习题 18-1 Java数据库编程 18-2 JDBC类和接口 18-3 JDBC操作SQL 18-4 JDBC基本示例 18-5 JDBC应用示例 18-6 练习题 19-1 。。。
完整版:https://download.csdn.net/download/qq_27595745/89522468 【课程大纲】 1-1 什么是java 1-2 认识java语言 1-3 java平台的体系结构 1-4 java SE环境安装和配置 2-1 java程序简介 2-2 计算机中的程序 2-3 java程序 2-4 java类库组织结构和文档 2-5 java虚拟机简介 2-6 java的垃圾回收器 2-7 java上机练习 3-1 java语言基础入门 3-2 数据的分类 3-3 标识符、关键字和常量 3-4 运算符 3-5 表达式 3-6 顺序结构和选择结构 3-7 循环语句 3-8 跳转语句 3-9 MyEclipse工具介绍 3-10 java基础知识章节练习 4-1 一维数组 4-2 数组应用 4-3 多维数组 4-4 排序算法 4-5 增强for循环 4-6 数组和排序算法章节练习 5-0 抽象和封装 5-1 面向过程的设计思想 5-2 面向对象的设计思想 5-3 抽象 5-4 封装 5-5 属性 5-6 方法的定义 5-7 this关键字 5-8 javaBean 5-9 包 package 5-10 抽象和封装章节练习 6-0 继承和多态 6-1 继承 6-2 object类 6-3 多态 6-4 访问修饰符 6-5 static修饰符 6-6 final修饰符 6-7 abstract修饰符 6-8 接口 6-9 继承和多态 章节练习 7-1 面向对象的分析与设计简介 7-2 对象模型建立 7-3 类之间的关系 7-4 软件的可维护与复用设计原则 7-5 面向对象的设计与分析 章节练习 8-1 内部类与包装器 8-2 对象包装器 8-3 装箱和拆箱 8-4 练习题 9-1 常用类介绍 9-2 StringBuffer和String Builder类 9-3 Rintime类的使用 9-4 日期类简介 9-5 java程序国际化的实现 9-6 Random类和Math类 9-7 枚举 9-8 练习题 10-1 java异常处理 10-2 认识异常 10-3 使用try和catch捕获异常 10-4 使用throw和throws引发异常 10-5 finally关键字 10-6 getMessage和printStackTrace方法 10-7 异常分类 10-8 自定义异常类 10-9 练习题 11-1 Java集合框架和泛型机制 11-2 Collection接口 11-3 Set接口实现类 11-4 List接口实现类 11-5 Map接口 11-6 Collections类 11-7 泛型概述 11-8 练习题 12-1 多线程 12-2 线程的生命周期 12-3 线程的调度和优先级 12-4 线程的同步 12-5 集合类的同步问题 12-6 用Timer类调度任务 12-7 练习题 13-1 Java IO 13-2 Java IO原理 13-3 流类的结构 13-4 文件流 13-5 缓冲流 13-6 转换流 13-7 数据流 13-8 打印流 13-9 对象流 13-10 随机存取文件流 13-11 zip文件流 13-12 练习题 14-1 图形用户界面设计 14-2 事件处理机制 14-3 AWT常用组件 14-4 swing简介 14-5 可视化开发swing组件 14-6 声音的播放和处理 14-7 2D图形的绘制 14-8 练习题 15-1 反射 15-2 使用Java反射机制 15-3 反射与动态代理 15-4 练习题 16-1 Java标注 16-2 JDK内置的基本标注类型 16-3 自定义标注类型 16-4 对标注进行标注 16-5 利用反射获取标注信息 16-6 练习题 17-1 顶目实战1-单机版五子棋游戏 17-2 总体设计 17-3 代码实现 17-4 程序的运行与发布 17-5 手动生成可执行JAR文件 17-6 练习题 18-1 Java数据库编程 18-2 JDBC类和接口 18-3 JDBC操作SQL 18-4 JDBC基本示例 18-5 JDBC应用示例 18-6 练习题 19-1 。。。
完整版:https://download.csdn.net/download/qq_27595745/89522468 【课程大纲】 1-1 什么是java 1-2 认识java语言 1-3 java平台的体系结构 1-4 java SE环境安装和配置 2-1 java程序简介 2-2 计算机中的程序 2-3 java程序 2-4 java类库组织结构和文档 2-5 java虚拟机简介 2-6 java的垃圾回收器 2-7 java上机练习 3-1 java语言基础入门 3-2 数据的分类 3-3 标识符、关键字和常量 3-4 运算符 3-5 表达式 3-6 顺序结构和选择结构 3-7 循环语句 3-8 跳转语句 3-9 MyEclipse工具介绍 3-10 java基础知识章节练习 4-1 一维数组 4-2 数组应用 4-3 多维数组 4-4 排序算法 4-5 增强for循环 4-6 数组和排序算法章节练习 5-0 抽象和封装 5-1 面向过程的设计思想 5-2 面向对象的设计思想 5-3 抽象 5-4 封装 5-5 属性 5-6 方法的定义 5-7 this关键字 5-8 javaBean 5-9 包 package 5-10 抽象和封装章节练习 6-0 继承和多态 6-1 继承 6-2 object类 6-3 多态 6-4 访问修饰符 6-5 static修饰符 6-6 final修饰符 6-7 abstract修饰符 6-8 接口 6-9 继承和多态 章节练习 7-1 面向对象的分析与设计简介 7-2 对象模型建立 7-3 类之间的关系 7-4 软件的可维护与复用设计原则 7-5 面向对象的设计与分析 章节练习 8-1 内部类与包装器 8-2 对象包装器 8-3 装箱和拆箱 8-4 练习题 9-1 常用类介绍 9-2 StringBuffer和String Builder类 9-3 Rintime类的使用 9-4 日期类简介 9-5 java程序国际化的实现 9-6 Random类和Math类 9-7 枚举 9-8 练习题 10-1 java异常处理 10-2 认识异常 10-3 使用try和catch捕获异常 10-4 使用throw和throws引发异常 10-5 finally关键字 10-6 getMessage和printStackTrace方法 10-7 异常分类 10-8 自定义异常类 10-9 练习题 11-1 Java集合框架和泛型机制 11-2 Collection接口 11-3 Set接口实现类 11-4 List接口实现类 11-5 Map接口 11-6 Collections类 11-7 泛型概述 11-8 练习题 12-1 多线程 12-2 线程的生命周期 12-3 线程的调度和优先级 12-4 线程的同步 12-5 集合类的同步问题 12-6 用Timer类调度任务 12-7 练习题 13-1 Java IO 13-2 Java IO原理 13-3 流类的结构 13-4 文件流 13-5 缓冲流 13-6 转换流 13-7 数据流 13-8 打印流 13-9 对象流 13-10 随机存取文件流 13-11 zip文件流 13-12 练习题 14-1 图形用户界面设计 14-2 事件处理机制 14-3 AWT常用组件 14-4 swing简介 14-5 可视化开发swing组件 14-6 声音的播放和处理 14-7 2D图形的绘制 14-8 练习题 15-1 反射 15-2 使用Java反射机制 15-3 反射与动态代理 15-4 练习题 16-1 Java标注 16-2 JDK内置的基本标注类型 16-3 自定义标注类型 16-4 对标注进行标注 16-5 利用反射获取标注信息 16-6 练习题 17-1 顶目实战1-单机版五子棋游戏 17-2 总体设计 17-3 代码实现 17-4 程序的运行与发布 17-5 手动生成可执行JAR文件 17-6 练习题 18-1 Java数据库编程 18-2 JDBC类和接口 18-3 JDBC操作SQL 18-4 JDBC基本示例 18-5 JDBC应用示例 18-6 练习题 19-1 。。。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值