【大数据分析】MLlib：线性代数

sword_csdn

已于 2022-08-11 12:37:35 修改

阅读量506

点赞数

分类专栏： Spark 文章标签：数据分析 mllib 线性代数

于 2020-06-02 20:03:47 首次发布

本文链接：https://blog.csdn.net/sword_csdn/article/details/106497346

版权

线性代数是数学的分支，专注于向量空间和线性运算，它们之间的映射主要由矩阵表示。Spark中的矩阵和向量可以在本地或以分布式方式进行操作。Spark中分布式矩阵的实现使用户能够跨越大量机器对大量数据进行线性代数运算。对于局部线性代数操作，Spark使用非常快的Breeze和jblas（Python的Numpy），并且它具有自己的分布式实现。

本地向量和矩阵实现

spark中的本地向量和矩阵实现位于org.apache.spark.mllib.linalg中。

生成本地向量

Spark中的本地向量使用DenseVector和SparseVector两个类实现，它们实现了一个名为Vector的通用接口，确保两个实现都支持完全相同的操作集。创建向量可以使用Vector类的dense和sparse方法。对于dense方法可以传入多个元素作为参数，也可以传入Array数组。sparse方法，则需要指定向量大小，索引数组和元素数组。

import org.apache.spark.mllib.linalg.{
   Vectors,Vector}
val dv1:Vector = Vectors.dense(5.0,6.0,7.0,8.0)
val dv2:Vector = Vectors.dense(Array(5.0,6.0,7.0,8.0))
val sv:Vector = Vectors.sparse(

最低0.47元/天解锁文章

sword_csdn

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
【大数据分析】MLlib：线性代数

目录本地向量和矩阵实现生成本地向量本地向量线性代数运算生成本地密集矩阵生成局部稀疏矩阵分布式矩阵RowMatrixIndexedRowMatrixCoordinateMatrixBlockMatrix具有分布式矩阵的线性代数运算线性代数是数学的分支，专注于向量空间和线性运算，它们之间的映射主要由矩阵表示。Spark中的矩阵和向量可以在本地或以分布式方式进行操作。Spark中分布式矩阵的实现使用户能够跨越大量机器对大量数据进行线性代数运算。对于局部线性代数操作，Spark使用非常快的Breeze和jblas
复制链接

扫一扫