【Spark+NLP】17、spark-ml + spark-sql_关于rdd和dataframe的踩坑血泪史

本文记录了使用Spark MLlib的Word2Vec生成词向量并将其存储在DataFrame中的过程,遇到的`saveAsTestFile()`方法无法使用的问题,以及DataFrame与RDD之间的转换。在解决问题的过程中,尝试了各种方法,最终通过将DataFrame转换为RDD成功输出了词向量。
摘要由CSDN通过智能技术生成

说明:

因为后期要做基于spark的项目,本人懒得纯手打了,决定在别的项目基础上修改过来即可。

项目中要用到spark-ml的word2vec生成词向量,于是直接借用之前的手机短信项目的前半截了。

代码不贴了,写下心得:

利用spark-mllib库现成的word2vec轻轻松松几句代码就实现了。得到的词向量等内容存储在preResultDF中,我想看下生成的词向量什么样。

1、saveAsTestFile()

百度告诉我用这个输出就能看了,结果我写了preResultDF.saveAsTestFile()报错:Cannot Resolve Symbol saveAsTestFile

我百度解决方案,度娘告诉我maven有个通用解决方式,随便百度了个:https://blog.csdn.net/qq_17312239/article/details/80279413

可是对我没半点用,哭了。(我百度了别人写的saveAsTestFile是可运行的,说明我代码写的不对)

 

2、强行运行,看IDEA能不能多给点提示

本以为 preResultDF是个rdd,尝试使用rdd.saveAsTestFile()结果报错Error

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值