word2vec的spark实现_spark之word2vec使用(python)

最新推荐文章于 2022-10-31 10:29:45 发布

weixin_39936792

最新推荐文章于 2022-10-31 10:29:45 发布

阅读量131

点赞数

本文链接：https://blog.csdn.net/weixin_39936792/article/details/113550435

版权

from pyspark import SparkConf, SparkContext,SQLContext

from pyspark.sql import SparkSession

from pyspark.ml.feature import Word2Vec,CountVectorizer

conf = SparkConf().setAppName("yjs_rec")

sc = SparkContext(conf=conf)

sqlContext=SQLContext(sc)

'''

documentDF = sqlContext.createDataFrame([

("Hi I heard about Spark".split(" "),),

("I wish Java could use case classes".split(" "),),

("Logistic regression models are neat".split(" "),)

], ["text"])

'''

spark_df = sqlContext.createDataFrame(documentDF)

#word2vec

word2Vec = Word2Vec(vectorSize=100, minCount=0, inputCol="words", outputCol="result")

model = word2Vec.fit(spark_df)

result = model.transform(spark_df)

result.select("result").show()

分享到：

2018-08-15 09:57

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

关注关注