Spark shell的实例操作

1、

scala> val inFile = sc.textFile("./spam.data")

   作用是将spam.data当作文本文件加载到Spark中,将spam.data文件中的每行作为一个RDD中的单独元素加载到Spark中,并返回一个名为inFile的RDD。

 

 

   2、

scala> val inFile = sc.textFile([filepath])

   作用是,在本地模式下,可以将文件从本地直接加载。

 

 

   3、

scala> import spark.SparkFiles;
scala> val file = sc.addFile("spam.data")
scala> val inFile = sc.textFile(SparkFiles.get("spam.data"))

    作用是,让spam.data文件在所有机器上都有备份,使用了SparkContext类中的addFile函数。

 

 

   4、

scala> val nums = inFile.map(x => x.split(' ').map(_.toDouble))

    作用是比较nums和inFile这两个RDD,确认一下两种数据的内容是一致的。

    注意了,x=>x.toDouble与_.toDouble等价

 

 

 

  5、

scala> inFile.first()

     作用是查看你inFile这个RDD中的第一个元素

 

 

 

  6、

  想清晰的学习,请移步


本文转自大数据躺过的坑博客园博客,原文链接:http://www.cnblogs.com/zlslch/p/5717855.html,如需转载请自行联系原作者

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值