spark读取parquet文件

最新推荐文章于 2024-03-04 20:27:22 发布

qq_43193797

最新推荐文章于 2024-03-04 20:27:22 发布

阅读量1.4k

点赞数 1

分类专栏： spark

本文链接：https://blog.csdn.net/qq_43193797/article/details/102546079

版权

spark 专栏收录该内容

45 篇文章 1 订阅

订阅专栏

spark-shell读取parquet文件

1、

进入spark-shell窗口

2、

val sqlContext = new org.apache.spark.sql.SQLContext(sc)

3、

val parquetFile = sqlContext.parquetFile("hdfs://cdp/user/az-user/sparkStreamingKafka2HdfsData/part-00000-ff60a7d3-bf91-4717-bd0b-6731a66b9904-c000.snappy.parquet")

hdfs://cdp是defaultFS，也可以不写，如下:

val parquetFile2 = sqlContext.parquetFile("/user/az-user/sparkStreamingKafka2HdfsData/part-00000-ff60a7d3-bf91-4717-bd0b-6731a66b9904-c000.snappy.parquet")

4、
parquetFile.take(30).foreach(println)

优惠劵

qq_43193797

关注关注

1
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
spark读取parquet文件

spark-shell读取parquet文件1、进入spark-shell窗口2、val sqlContext = new org.apache.spark.sql.SQLContext(sc)3、val parquetFile = sqlContext.parquetFile("hdfs://cdp/user/az-user/sparkStreamingKafka2Hd...
复制链接

扫一扫