稀疏矩阵:0 多
稠密矩阵:0 少,非0 多
稀疏矩阵
如果矩阵中的许多系数都为零,那么该矩阵就是稀疏的。对稀疏现象有兴趣是因为它的开发可以带来巨大的计算节省,并且在许多大的实践中都会出现矩阵稀疏的问题。
- 矩阵的稀疏性可以用一个得分来量化,也就是矩阵中零值的个数除以矩阵中元素的总个数。
sparsity = count zero elements / total elements
稀疏矩阵的问题
-
稀疏矩阵会导致空间复杂度和时间复杂度的问题。
空间复杂度
-
非常大的矩阵需要大量的内存,而我们想要处理的一些非常大的矩阵是稀疏的
时间复杂度
-
假设一个非常大的稀疏矩阵可以适应内存,我们将需要对这个矩阵执行操作。
-
原因:大部分时间需要计算零值的相加或相乘
机器学习中的稀疏矩阵
稀疏矩阵在某些特定类型的数据中出现,最值得注意的是记录活动的发生或计数的观察。
数据
三个例子包括:
- 用户是否在一个电影目录中有曾经看过的电影。
- 用户是否在一个产品目录中有已经购买过的产品。
- 在一个歌曲目录中数出收听过的歌曲的数量
数据准备
在准备数据时,稀疏矩阵会出现在编码方案中。
三个例子:</