python调用sql插入none_Databricks 第2篇：pyspark.sql 简介

最新推荐文章于 2022-12-22 18:57:22 发布

杜绍斐 DUSHAOFEI

最新推荐文章于 2022-12-22 18:57:22 发布

阅读量210

点赞数

文章标签： python调用sql插入none

本文链接：https://blog.csdn.net/weixin_33413018/article/details/113625874

版权

pyspark中的DataFrame等价于Spark SQL中的一个关系表。在pyspark中，DataFrame由Column和Row构成。

pyspark.sql.SparkSession：是DataFrame和SQL函数的主要入口DataFrameReader：读取数据，返回DataFrameDataFrameWriter：把DataFrame存储到其他存储系统pyspark.sql.DataFrame、pyspark.sql.Column和 pyspark.sql.Row

一，SparkSession类

在操作DataFrame之前，首先需要创建SparkSession，通过SparkSession来操作DataFrame。

1，创建SparkSession

通过Builder类来创建SparkSession，在Databricks Notebook中，spark是默认创建，表示一个SparkSession对象：

spark = SparkSession.builder     .master("local")     .appName("Word Count")     .config("spark.some.config.option", "some-value")     .getOrCreate()

函数注释:

master(master)：用于设置要连接的Spark的master URL，例如local表示在本地运行，local[4] 在本地使用4核运行，appName(name)&#x

最低0.47元/天解锁文章

杜绍斐 DUSHAOFEI

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
python调用sql插入none_Databricks 第2篇：pyspark.sql 简介

pyspark中的DataFrame等价于Spark SQL中的一个关系表。在pyspark中，DataFrame由Column和Row构成。pyspark.sql.SparkSession：是DataFrame和SQL函数的主要入口DataFrameReader：读取数据，返回DataFrameDataFrameWriter：把DataFrame存储到其他存储系统pyspark.sql.Data...
复制链接

扫一扫