spark 字符串操作

最新推荐文章于 2022-04-18 22:12:13 发布

鸭梨山大哎

最新推荐文章于 2022-04-18 22:12:13 发布

阅读量1k

点赞数 1

分类专栏： spark 文章标签： scala

本文链接：https://blog.csdn.net/u010711495/article/details/109765724

版权

spark 专栏收录该内容

121 篇文章 8 订阅

订阅专栏

//java的split方法,返回值为数组
scala> "apple".split("")
res35: Array[String] = Array(a, p, p, l, e)
//利用字符串构建rdd
scala>  val rdd = sc.parallelize("apple")
rdd: org.apache.spark.rdd.RDD[Char] = ParallelCollectionRDD[28] at parallelize at <console>:24
//字符串相当于char数组,因此也可以用map
scala> rdd.map(_*2).collect
res36: Array[Int] = Array(194, 224, 224, 216, 202)
//必须说明对元素的处理
scala> rdd.map(_).collect
<console>:27: error: missing parameter type for expanded function ((x$1) => rdd.map(x$1).collect)
       rdd.map(_).collect
               ^
//字符串是数组,也可以使用过滤filter
scala> rdd.filter(_=='a').collect
res38: Array[Char] = Array(a)
//从char数组取值
scala> rdd.take(1)
res39: Array[Char] = Array(a)

scala> rdd.take(2)
res40: Array[Char] = Array(a, p)
//rdd没有split方法
scala> rdd.split("")
<console>:27: error: value split is not a member of org.apache.spark.rdd.RDD[Char]
       rdd.split("")
           ^

鸭梨山大哎

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
spark 字符串操作

//java的split方法,返回值为数组scala> "apple".split("")res35: Array[String] = Array(a, p, p, l, e)//利用字符串构建rddscala> val rdd = sc.parallelize("apple")rdd: org.apache.spark.rdd.RDD[Char] = ParallelCollectionRDD[28] at parallelize at <console>:24//字
复制链接

扫一扫