Spark Core:第一章 Spark Shell

本文介绍了如何使用Spark Shell进行交互式编程,包括启动Spark Shell、编写并执行WordCount程序,以及解决启动过程中遇到的问题。详细步骤涵盖从启动HDFS、上传文件,到在shell中编写和运行程序,最后在IDEA中实现相同功能。同时,文章还讨论了一个Hive配置警告的解决方案。
摘要由CSDN通过智能技术生成

Spark Core:第一章 spark shell



—>Spark知识点总结导航<—


一、关于spark-shell

  spark-shell是spark自带的交互式shell程序,方便用户进行交互式编程,用户可以在该命令行下用scala编写spark程序。


二、启动spark-shell

  开启HDFS和spark集群
在这里插入图片描述
~/software/spark/bin/spark-shell
(如果不成功请参考文末的Q1)
在这里插入图片描述

  • 注意:
    如果启动spark shell时没有指定master地址,但是也可以正常启动spark shell和执行spark shell中的程序,其实是启动了spark的cluster模式,如果spark是单节点,并且没有指定slave文件,这个时候如果打开spark-shell 默认是local模式
  • Local模式是master和worker在同同一进程内
  • Cluster模式是master和worker在不同进程内

三、spark-shell中编写WordCount程序

1. 启动HDFS

在这里插入图片描述

2. 上传文件到HDFS

在这里插入图片描述

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值