spark RDD 示例

spark Context  sc

spark RDD 存储单元

       --示例1
hadoop fs -put /home/training/training_materials/data/frostroad.txt  /loudacre/frostroad.txt
        val myrdd=sc.textFile("/loudacre/frostroad.txt")
myrdd.count()
myrdd.collect()


        --示例2
hadoop dfs -put /home/training/training_materials/data/weblogs/  /loudacre/


val logfiles="/loudacre/weblogs/*"


val logsRDD=sc.textFile(logfiles)
logsRDD.count()
logsRDD.take(1).foreach(println)


val jpglogsRDD=logsRDD.filter(line => line.contains(".jpg"))


        jpglogsRDD.take(10).foreach(println)
jpglogsRDD.count()
        logsRDD.map(line =>line.length).take(5)


        --示例3
        hadoop fs -put /home/training/training_materials/data/purplecow.txt  /loudacre/purplecow.txt
        val mydata=sc.textFile("/loudacre/purplecow.txt")


for(line<-mydata.take(2))
println(line)


mydata.take(2).foreach(println)

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值