spark学习系列——2 WordCount

经典的例子

首先上传文件到hdfs,再启动spark-shell,进行计算

[bdpos@BJHC-Client-18562 spark]$ hdfs dfs -mkdir /spark/input
[bdpos@BJHC-Client-18562 spark]$ hdfs dfs -put ./README.md /spark/input
[bdpos@BJHC-Client-18562 spark]$ hdfs dfs -ls /spark/input
Found 1 items
-rw-r--r--   2 bdpos supergroup       3818 2018-03-20 19:07 /spark/input/README.md
scala> sc.textFile("/spark/input/README.md").flatMap(line => line.split(" ")).map(word => (word,1)).reduceByKey(_+_).sortBy(t=>t._2,false).take(10)
res9: Array[(String, Int)] = Array(("",71), (the,24), (to,17), (Spark,16), (for,12), (and,9), (a,8), (##,8), (run,7), (on,7))



  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值