Spark-MLlib的快速使用之一(数据类型)

1、Vector 

数学向量,MLlib既支持稠密向量也支持稀疏向量。

稠密向量: 向量的每一位都存储下来。

稀疏向量:存储非零位以节约空间

 

2、LabeledPoint

表示带标签的数据点,包含一个特征向量与一个标签。

 

3、Model

训练算法的结果,通过predict()方法对新的数据进行预测

 

附:操作向量的基本实例

  1. object VectorsTest {
  2. def main(args: Array[String]): Unit = {
  3.  
  4. //创建稠密向量
  5. val denseVec1 = Vectors.dense(1, 2, 3)
  6. val denseVec2 = Vectors.dense(Array(1.0, 2.0, 3.0))
  7.  
  8. println(denseVec1)
  9. println(denseVec2)
  10.  
  11. //创建稀疏向量
  12. val sparseVec1 = Vectors.sparse(4, Array(0, 2), Array(1.0, 2.0))
  13. println(sparseVec1)
  14. }
  15. }

 

 

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值