SPARK-SQL 读取外部数据源 txt文件的读写

相关的资源文件地址

链接:https://pan.baidu.com/s/1QGQIrVwg56g9eF16ERSLwQ 
提取码:7v8n

txt 文件读写示例

import org.apache.spark.sql.Dataset;
import org.apache.spark.sql.Row;
import org.apache.spark.sql.SaveMode;
import org.apache.spark.sql.SparkSession;

public class test10 {
    public static void main(String[] args) {
        SparkSession spark = SparkSession
                .builder()
                .config("spark.driver.host", "localhost")
                .appName("TextFileTest")
                .master("local")
                .getOrCreate();

        spark.sparkContext().setLogLevel("ERROR");

        //1: 将json文件数据转化成text文件数据,
        //**********注意只能保存一列**********
        //compression 压缩编解码器
        //`none`, `bzip2`, `gzip`
        Dataset<Row> jsonDF = spark.read().json(Utils.BASE_PATH + "/people.json");
        jsonDF.select("name")
                .write()
                .mode(SaveMode.Overwrite)
                .option("compression", "bzip2")
                .text(Utils.BASE_PATH + "/text");

        //读取text文件,返回DataFrame
        Dataset<Row> textDF = spark.read().text(Utils.BASE_PATH + "/text");
        textDF.show();
//        +-------+
//        |  value|
//        +-------+
//        |Michael|
//        |   Andy|
//        | Justin|
//        +-------+

        //读取text文件,返回Dataset<String>
        Dataset<String> textDS = spark.read().textFile(Utils.BASE_PATH + "/text");
        textDS.show();
//        +-------+
//        |  value|
//        +-------+
//        |Michael|
//        |   Andy|
//        | Justin|
//        +-------+

        spark.stop();
    }
}

 

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值