SPARK-SQL 读取外部数据源 txt文件的读写

最新推荐文章于 2024-05-03 13:44:28 发布

小哇666

最新推荐文章于 2024-05-03 13:44:28 发布

阅读量1.4k

点赞数

分类专栏： # spark 文章标签： spark

本文链接：https://blog.csdn.net/qq_41712271/article/details/107911979

版权

spark 专栏收录该内容

76 篇文章 0 订阅

订阅专栏

相关的资源文件地址

链接：https://pan.baidu.com/s/1QGQIrVwg56g9eF16ERSLwQ 
提取码：7v8n

txt 文件读写示例

import org.apache.spark.sql.Dataset;
import org.apache.spark.sql.Row;
import org.apache.spark.sql.SaveMode;
import org.apache.spark.sql.SparkSession;

public class test10 {
    public static void main(String[] args) {
        SparkSession spark = SparkSession
                .builder()
                .config("spark.driver.host", "localhost")
                .appName("TextFileTest")
                .master("local")
                .getOrCreate();

        spark.sparkContext().setLogLevel("ERROR");

        //1: 将json文件数据转化成text文件数据，
        //**********注意只能保存一列**********
        //compression 压缩编解码器
        //`none`, `bzip2`, `gzip`
        Dataset<Row> jsonDF = spark.read().json(Utils.BASE_PATH + "/people.json");
        jsonDF.select("name")
                .write()
                .mode(SaveMode.Overwrite)
                .option("compression", "bzip2")
                .text(Utils.BASE_PATH + "/text");

        //读取text文件，返回DataFrame
        Dataset<Row> textDF = spark.read().text(Utils.BASE_PATH + "/text");
        textDF.show();
//        +-------+
//        |  value|
//        +-------+
//        |Michael|
//        |   Andy|
//        | Justin|
//        +-------+

        //读取text文件，返回Dataset<String>
        Dataset<String> textDS = spark.read().textFile(Utils.BASE_PATH + "/text");
        textDS.show();
//        +-------+
//        |  value|
//        +-------+
//        |Michael|
//        |   Andy|
//        | Justin|
//        +-------+

        spark.stop();
    }
}

小哇666

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
SPARK-SQL 读取外部数据源 txt文件的读写

相关的资源文件地址链接：https://pan.baidu.com/s/1QGQIrVwg56g9eF16ERSLwQ 提取码：7v8ntxt 文件读写示例import org.apache.spark.sql.Dataset;import org.apache.spark.sql.Row;import org.apache.spark.sql.SaveMode;import org.apache.spark.sql.SparkSession;public class test
复制链接

扫一扫

专栏目录