spark 字符串操作

//java的split方法,返回值为数组
scala> "apple".split("")
res35: Array[String] = Array(a, p, p, l, e)
//利用字符串构建rdd
scala>  val rdd = sc.parallelize("apple")
rdd: org.apache.spark.rdd.RDD[Char] = ParallelCollectionRDD[28] at parallelize at <console>:24
//字符串相当于char数组,因此也可以用map
scala> rdd.map(_*2).collect
res36: Array[Int] = Array(194, 224, 224, 216, 202)
//必须说明对元素的处理
scala> rdd.map(_).collect
<console>:27: error: missing parameter type for expanded function ((x$1) => rdd.map(x$1).collect)
       rdd.map(_).collect
               ^
//字符串是数组,也可以使用过滤filter
scala> rdd.filter(_=='a').collect
res38: Array[Char] = Array(a)
//从char数组取值
scala> rdd.take(1)
res39: Array[Char] = Array(a)

scala> rdd.take(2)
res40: Array[Char] = Array(a, p)
//rdd没有split方法
scala> rdd.split("")
<console>:27: error: value split is not a member of org.apache.spark.rdd.RDD[Char]
       rdd.split("")
           ^
  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值