Spark入门指南 - 1.3 spark shell介绍

Spark shell提供了一种学习API的简单方法,以及一种以交互方式分析数据的强大工具。它可以在Scala(在Java VM上运行,因此是使用现有Java库的好方法)或Python中使用。

scala 命令行启动方式  ./bin/spark-shell

python 命令行启动方式 ./bin/pyspark

下面我们用scala的方式启动

a570a8150c407eafec182785a685a2166aa.jpg

读取本地文件README.md,并统计

d77f9c989a318e5ac175b543c316d67b095.jpg

命令交互窗也支持Linux 传统的 tab补全还是比较好用

下面再来一个入门的统计

b8ee628ef2925bfc066583c1cbb234e72cc.jpg

4f0163ec648941202f4b1e942957dc1579d.jpg

58fe96e8fbed0bfee7f565f7eb297965564.jpg

统计spark出现的次数。

shell只是提供给我们一个更便捷的学习方式,具体的任务还需要编写代码提交运行。

 

转载于:https://my.oschina.net/jlcao/blog/3013415

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值