word2vec的spark实现_Spark的Word2Vec示例

import org.apache.spark.ml.feature.{Word2Vec, Word2VecModel}import org.apache.spark.ml.linalg.Vectorimport org.apache.spark.sql.{DataFrame, SaveMode, SparkSession}/*** 从句子训练得到Embedding*/object TextEmb...
摘要由CSDN通过智能技术生成

import org.apache.spark.ml.feature.{Word2Vec, Word2VecModel}

import org.apache.spark.ml.linalg.Vector

import org.apache.spark.sql.{DataFrame, SaveMode, SparkSession}

/**

* 从句子训练得到Embedding

*/

object TextEmbedding {

val embeddingSize = 3

def main(args: Array[String]): Unit = {

val spark = SparkSession.builder()

.appName("TextEmbedding")

.master("local[2]")

.getOrCreate()

val df = loadText(spark)

val model = trianByWord2Vec(spark, df)

saveModel(spark, model, args(0))

saveTextEmb(spark, model, df, args(1))

saveWordEmb(spark, model, args(2))

loadModel(spark, args(0))

}

// 示例

def loadText(spark: SparkSession): DataFrame = {

val df = spark.createDataFrame(Seq(

(0, Array("Hi", 

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值