模型优化【1】-低秩近似

最新推荐文章于 2025-03-26 23:08:26 发布

豫州刺史

最新推荐文章于 2025-03-26 23:08:26 发布

阅读量897

点赞数

分类专栏：模型优化/压缩文章标签：模型优化模型压缩模型轻量化 python

本文链接：https://blog.csdn.net/s1_0_2_4/article/details/134606186

版权

2 篇文章

订阅专栏

一、低秩近似

神经网络的基本运算卷积，实则就是矩阵运算，低秩近似的技术是通过一系列小规模矩阵将权重矩阵重构出来，以此降低运算量和存储开销。
目前有两种常用的方法实现低秩近似：

Toeplitz矩阵【托普利兹】直接重构权重矩阵，简称为T型矩阵，它是由Bryc、Dembo、Jiang于2006年提出的。托普利兹矩阵的主对角线上的元素相等，平行于主对角线的线上的元素也相等；
奇异值分解（SVD），将权重矩阵分解为若干个小矩阵。

下面以奇异值分解为例，从运算开销和计算开销方面展示低秩近似在模型压缩中作用.
前提：假设原始矩阵为m*n，其中m=n=100，如果使用奇异值分解，并保留前k个奇异值，那么近似矩阵可以通过三个更小的矩阵表示：U_k(m * k)、S_k(k * k)、Vt_k(k * n)，令k=10。

存储开销

计算开销

计算U_k * S_k的乘法开销
- U_k的大小是m * k，S_k的大小是k * k，每个元素的计算需要k次乘法。
- 所以U_k * S_k的计算开销是k * (m * k)=m *k * k=100 * 10 * 10 = 10000
计算 (U_k * S_k) * Vt_k 的乘法开销
- U_k * S_k 的结果是一个 m x k 矩阵, Vt_k 的大小是 k x n，
- 每个元素的计算需要 k 次乘法，
- 所以(U_k * S_k) * Vt_k的乘法开销是k * (m * n) = 10 * 100 * 100=100000