sparkSql 随机打散分配

UDF 函数
val randomNew = (str :String, n: Int) => {
        val buffer = ArrayBuffer[Int](-1)
        var length:Int = 1
        var index:Int = -1
        for(a <- str){
          index = index + 1
          if (a ==':') {
            length = length+1
            buffer +=index
          }
        }
        val routeKey = length <= n
        routeKey match {
          case true => str
          case _ => {
            val index = (new Random).nextInt(length)
            if(index+n < length){
              str.slice(buffer(index)+1,buffer(index+n)-1)
            }else if(index+n ==length){
              str.slice(buffer(index)+1,str.length)
            }else{
              val index2 =n-(length-index)
              str.slice(buffer(index)+1,str.length)+":"+str.slice(buffer(0),buffer(index2)-1)
            }
          }
        }
      }
      hive.udf.register("randomNew", randomNew)

假如有一串以 冒号 : 分割的字符串 val arr:String = “adfa:adfa:adag:asdf:hgfh:fgjgfj:fgjfjk:fjfkfjk”
随机获取三个子串的拼接字符串 randomNew(arr,3) adag:asdf:hgfh

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值