spark两个矩阵相乘

最新推荐文章于 2023-10-24 08:41:26 发布

MiaomiaoShow

最新推荐文章于 2023-10-24 08:41:26 发布

阅读量2.3k

点赞数

本文链接：https://blog.csdn.net/qq_17641711/article/details/80670547

版权

from __future__ import print_function


from pyspark.mllib.linalg import Matrices
from pyspark.mllib.linalg.distributed import BlockMatrix
from pyspark import SparkContext
from pyspark.sql import SQLContext
from pyspark.mllib.linalg.distributed import RowMatrix,IndexedRowMatrix,IndexedRow
import numpy as np
import sys
def parseVector(line):
    return np.array([float(x) for x in line.split(' ')])
def merge(line):
    tmp = []
    for i in line:
        tmp.extend(i)
    return tmp
def load_data(path):
    data = sc.textFile(path)
    line = data.map(parseVector)
    lines = map(lambda x:x.tolist(), line.collect())
    tmp_list = []
    for i in range(len(lines)):
        tmp_list.append(IndexedRow(i, lines[i]))
    #print(tmp_list)
    rows = sc.parallelize(tmp_list)
    mat = IndexedRowMatrix(rows).toBlockMatrix()
    return mat


if __name__ == "__main__":
    if len(sys.argv) != 3:
        pri

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

MiaomiaoShow

关注关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
spark两个矩阵相乘

from __future__ import print_functionfrom pyspark.mllib.linalg import Matricesfrom pyspark.mllib.linalg.distributed import BlockMatrixfrom pyspark import SparkContextfrom pyspark.sql import SQLC...
复制链接

扫一扫