spark sql 读文件txt,json（未写完）

最新推荐文章于 2023-06-13 21:03:46 发布

Axel_Fr

最新推荐文章于 2023-06-13 21:03:46 发布

阅读量118

点赞数

文章标签： spark 大数据

本文链接：https://blog.csdn.net/Axel_Fran/article/details/115861252

版权

pom 文件，配置如下

<dependencies>
    <dependency>
        <groupId>org.apache.spark</groupId>
        <artifactId>spark-sql_2.12</artifactId>
        <version>${spark.version}</version>

    </dependency>
    <dependency>
        <groupId>org.apache.spark</groupId>
        <artifactId>spark-hive_2.12</artifactId>
        <version>${spark.version}</version>

</dependency>

    <dependency>
        <groupId>com.thoughtworks.paranamer</groupId>
        <artifactId>paranamer</artifactId>
        <version>2.8</version>
    </dependency>

</dependencies>

首先获得sparkSession

public static void getSparkSession(){
     spark=SparkSession.builder()
            .appName("review with StructType").master("local")
            .config("spark.some.confif.option","some-value")
            .getOrCreate();
}

读txt 文件

javaRDD与toJavaRDD

text() 与textFile() 方法区别

map 方法的两种不同写法

RDD 类型装换为 Dataset<Row> 的两种映射类型

第一种 javaBean 第二种 StructType

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

Axel_Fr

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
spark sql 读文件txt,json（未写完）

pom 文件，配置如下<dependencies> <dependency> <groupId>org.apache.spark</groupId> <artifactId>spark-sql_2.12</artifactId> <version>${spark.version}</version> </dependency>...
复制链接

扫一扫