Spark SQL API

最新推荐文章于 2024-05-06 17:13:11 发布

qq_2631218300

最新推荐文章于 2024-05-06 17:13:11 发布

阅读量664

点赞数

分类专栏： spark 文章标签： spark

本文链接：https://blog.csdn.net/xiaoxionghanhan/article/details/109727874

版权

Spark SQL架构
Spark SQL是Spark的核心组件之一（2014.4 Spark1.0）
能够直接访问现存的Hive数据
提供JDBC/ODBC接口供第三方工具借助Spark进行数据处理
提供了更高层级的接口方便地处理数据
支持多种操作方式：SQL、API编程
支持多种外部数据源：Parquet、JSON、RDBMS等

SparkContext
SQLContext：Spark SQL的编程入口
HiveContext：SQLContext的子集，包含更多功能
SparkSession（Spark 2.x推荐）
SparkSession：合并了SQLContext与HiveContext，提供与Spark功能交互单一入口点，并允许使用DataFrame和Dataset API对Spark进行编程

Dataset
特定域中的强类集合

scala> spark.createDataset(1 to 3).show
scala> spark.createDataset(List(("a",1),("b",2),("c",3))).show
scala> spark.createDataset(sc.parallelize(List(("a",1,1),("b",2,2)))).show

最低0.47元/天解锁文章

qq_2631218300

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
Spark SQL API

Spark SQL架构Spark SQL是Spark的核心组件之一（2014.4 Spark1.0）能够直接访问现存的Hive数据提供JDBC/ODBC接口供第三方工具借助Spark进行数据处理提供了更高层级的接口方便地处理数据支持多种操作方式：SQL、API编程支持多种外部数据源：Parquet、JSON、RDBMS等SparkContextSQLContext：Spark SQL的编程入口HiveContext：SQLContext的子集，包含更多功能SparkSession（Spa
复制链接

扫一扫