pyspark.linalg模块学习

pyspark.ml.linalg模块提供了向量和矩阵类,包括DenseVector、SparseVector、Vectors和DenseMatrix、SparseMatrix。DenseVector支持点积、正则化、非零元素计数等操作;SparseVector具有相同的特性,且优化了存储非零元素。Vectors工厂方法能创建dense和sparse向量,提供计算向量范数和平方距离的功能。DenseMatrix和SparseMatrix则对应稠密和稀疏矩阵,支持转换为其他形式。
摘要由CSDN通过智能技术生成

class pyspark.ml.linalg.Vector

方法

toArray(): 把vector转换为numpy.ndarray

class pyspark.ml.linalg.DenseVector(ar)

v = Vectors.dense([1.0, 2.0])
u = Vectors.dense([3.0, 4.0])
#可以进行加减乘除
v + u  #DenseVector([4.0, 6.0])
v * u #DenseVector([3.0, 8.0])

方法

dot(other): 计算两向量的点积,支持Numpy array, list, SparseVector, Scipy sparse
norm(p):计算SparseVector的正则化
numNonzeros(): 非零元素个数
size: 向量大小
squared_distance(other):到Spars

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值