spark任务导入自定义配置文件

本文介绍如何在Spark任务中导入自定义配置文件以实现代码灵活性,通过修改配置文件内容来调整日期区间过滤等逻辑。示例中展示了配置文件结构,并提到了在集群上运行时如何传递配置文件路径。
摘要由CSDN通过智能技术生成

        在开发代码的时候,想要让自己的代码更加灵活,可以采用导入自定义配置文件的方法,这样我们每次只需要修改配置文件的内容达到更改代码部分逻辑的目的,使代码更加灵活。

object Test{
    def main(args:Array[String]):Unit={
        val spark = SparkSession.builder().appName("test")
        .conf("hive.exec.dynamic.partition","true")
        .conf("hive.exec.dynamic.partition.mode","nonstrict")
        .enableHiveSupport().getOrCreate()
        
        // 读取自定义配置文件
        val rows = spark.read.text(args(0)).collectAsList()

        var filter_str = ""
        var date = args(1)

        for (i <- until < rows.size()){
            
            //[20230101    20230201    (1,2)]所以要将"[","]"替换成空
            val config_str = rows.get(i).toString().replaceAll("\\[|\\]","")
            
            //切割字符串获取开始、结束日期,过滤条件
            val start_date = config_str.split("\t")(0)
    
  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值