Spark安装与基本操作

Spark安装与基本操作

  • spark的下载通过访问spark官网下载自己Hadoop对应的版本吧,
  • spark安装包:https://dlcdn.apache.org/spark/spark-3.4.0/spark-3.4.0-bin-hadoop3-scala2.13.tgz
  • 然后通过上传工具上传到虚拟里的自己的 目录里,

spark安装

1.进入到 你上传的目录里,解压压缩包

tar -zvxf spark-2.4.0-bin-without-hadoop.tgz        ##spark-2.4.0-bin-without-hadoop.tgz为你自己在官网下载的压缩包

2.将解压的压缩包重命名为spark

 mv spark-2.4.0-bin-without-hadoop spark

3.修改权限

chown -R root:root ./spark

4.修改spark-env.sh.template文件

cd /usr/java/spark/conf    ##进入spark安装路径下的conf文件夹

cp spark-env.sh.template spark-env.sh

5.配置环境变量,进入 /etc/profile ,在文件末尾添加Spark的PATH路径

vim /etc/profile
export SPARK_HOME=/uar/java/spark   ##spark 的安装路径
export PATH=$SPARK_HOME/bin:$PATH

6.运行下面的命令使配置生效

source /etc/profile

7.启动

cd /usr/local/spark/bin/
./run-example SparkPi    #计算pi值
./spark-shell            #启动spark 
scala>:quit              # 退出spark             

运行spark示例

cd /usr/java/spark/bin/
./run-example SparkPi
./run-example SparkPi SparkPi 2>&1 |grep "PI is roughly"

在这里插入图片描述

交互分析

./spark-shell
 
 val textFile = sc.textFile("file:///usr/java/spark/README.md")

textFile.count()

textFile.first()

val linesWithSpark = textFile.filter(line =>line.contains("Spark"))

linesWithSpark.count()

textFile.filter(line =>line.contains("Spark")).count()

在这里插入图片描述

RDD

textFile.map(line=>line.split(" ").size).reduce((a,b)=>if(a>b) a else b)

import java.lang.Math
textFile.map(line=>line.split(" ").size).reduce((a,b)=>Math.max(a,b))

val wordCounts =textFile.flatMap(line=>line.split(" ")).map(word=>(word,1))reduceByKey((a,b)=>a+b)
wordCounts.collect()

在这里插入图片描述

缓存

val sqlContext = spark.sqlContext

val df= sqlContext.read.json("file:///usr/java/spark/examples/src/main/resources/people.json")

df.show()
df.select("name").show()
df.select(df("name"),df("age")+1).show()
df.filter(df("age")>21).show()
df.groupBy("age").count().show()

df.registerTempTable("people")
val result = sqlContext.sql("SELECT name,age FROM people WHERE age>=13 AND age<=19")
result.show()

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

  • 7
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值