在windows系统用idea开发spark

最新推荐文章于 2024-03-19 21:20:51 发布

desen210

最新推荐文章于 2024-03-19 21:20:51 发布

阅读量370

点赞数

分类专栏：程序设计

本文链接：https://blog.csdn.net/jd7082210/article/details/53699825

版权

程序设计同时被 2 个专栏收录

5 篇文章 0 订阅

订阅专栏

工具类

4 篇文章 0 订阅

订阅专栏

1，下载安装JDK，并配置环境变量，在shell里面验证是否安装成功

2，下载安装scala，并配置环境变量，验证是否安装成功（好像只有2.10.x版本能用）

3，下载安装idea，

4，下载对应idea版本的scala插件，可以在file----》plugins 里搜索对应的版本，然后自己下载，再添加上去，否则在idea里下载太慢

5，新建scala项目，点击 File -> Project Structure，在 “Dependencies” 标签界面下，点击右边绿色的 “+”号，选择第一个选项“JARs or directories...”，选择相应的jar包，点“OK”，jar包添加成功。--------添加spark-assembly-1.6.1-hadoop2.6.0.jar，在spark安装包的lib文件夹下

6，

val conf = new SparkConf().setMaster("local").setAppName("wordcount")
val sc = new SparkContext(conf)

创建spark的配置环境

7，编写spark程序

遇到问题：

1，sc.textFile()读取文件，打印输出的时候，中文乱码

解决transfer(sc,"C:\\Users\\lenovo\\Desktop\\patent.txt").flatMap(_.split(" ")).map((_,1)).reduceByKey(_+_)
    .foreach(x => println(x))


def transfer(sc:SparkContext,path:String):RDD[String]={
  sc.hadoopFile(path,classOf[TextInputFormat],classOf[LongWritable],classOf[Text],1)
    .map(p => new String(p._2.getBytes, 0, p._2.getLength, "GBK"))

desen210

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
在windows系统用idea开发spark

1，下载安装JDK，并配置环境变量，在shell里面验证是否安装成功2，下载安装scala，并配置环境变量，验证是否安装成功（好像只有2.10.x版本能用）3，下载安装idea，4，下载对应idea版本的scala插件，可以在file----》plugins 里搜索对应的版本，然后自己下载，再添加上去，否则在idea里下载太慢5，新建scala项目，点击 File -> Proj
复制链接

扫一扫