IDEA开发SparkSQL程序

SparkSession常用函数与方法

方法说明
builder创建一个sparkSession实例
version返回当前spark的版本
implicits引入隐式转化
emptyDataset[T]创建一个空DataSet
range创建一个DataSet[Long]
sql执行sql查询(返回一个dataFrame)
udf自定义udf(自定义函数)
table从表中创建DataFrame
catalog访问结构化查询实体的目录
read外部文件和存储系统读取DataFrame。
conf当前运行的configuration
readStream访问DataStreamReader以读取流数据集。
streams访问StreamingQueryManager以管理结构化流式传输查询。
newSession创建新的SparkSession
stop停止SparkSession
write访问DataStreamReader以写入流数据集。
appName任务名
config相关配置
getOrCreate检测器

实例

package com.day2

import org.apache.spark.sql.SparkSession
import org.apache.spark.{SparkConf, SparkContext}
import org.slf4j.LoggerFactory

import spark.implicits._

object HelloSQL {
    def main(args: Array[String]) {
        //创建SparkConf()并设置App名称
        val spark = SparkSession
            .builder()		//新建一个SparkSession对象
            .appName("Spark SQL basic example")	//作业名
            .config("spark.some.config.option", "some-value")	//相关配置	
            .getOrCreate()	//检测这个SparkSession是否存在,如果没有就创建,如果有就使用已有的

        val df = spark.read.json("/people.json")

        df.show()

        df.filter($"age" > 21).show()

        df.createOrReplaceTempView("persons")	// 创建临时表

        spark.sql("SELECT * FROM persons where age > 21").show()

        spark.stop()
    }
}

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

寒 暄

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值