Scala学习进击Spark(五): Scala集合

数组
不可变数组:

object ArrayApp extends App {
  val a = new Array[String](5)

  println(a.length)

  a(1) = "hello"
  foreachList(a)
  println()
  val b = Array("hadoop","spark","hive")
  foreachList(b)
  val c = Array(1,2,3,4,5,6,7,8)
  println("max="+c.max+
          " min="+c.min+
          " sum="+c.sum)
  println(c.mkString(" "))
  println(c.mkString("<"," ",">"))
  
  def foreachList(list: Array[String]): Unit ={
    for (i <- list){
      print(i+ "  ")
    }
  }
}

可变数组

val d = scala.collection.mutable.ArrayBuffer[Int]()

  d+=1
  d+=2
  d+=(3,4,5)//可以加多个
  d++=Array(6,7,8)//两个+加一个数组
  d.insert(0,0)//指定位置插入
  d.remove(1)//移除索引数据
  d.trimEnd(2)//倒叙删除
  println(d)
  for(i <- 0.until(d.length)){
    print(i+" ")
  }
  println()
  for(ele <-d){
    print(ele+" ")
  }
  println()
  for(i <- 0.until(d.length).reverse){//反序遍历
    print(i+" ")
  }

list
NIL为不可变的list

object ListApp extends App {

  val list = List(1,2,3,4,5)
  println(list) //List(1, 2, 3, 4, 5)
  println(list.head)//1,第一个元素
  println(list.tail)//List(2, 3, 4, 5),除第一个外都是tail

  val list1 = 1::Nil //为定长的list
  println(list1)

  val list2 = scala.collection.mutable.ListBuffer[Int]()//可变list

  list2+=1
  list2+=(2,3,4,5)
  list2++=List(6,6,7)
  list2-=2
  list2--=List(5,6)
  list2.toArray    //转成数组
  list2.toList    //转成定长list
  list2.isEmpty   //是否为空
  list2.head      //头元素
}

 //递归求和
  def sum(nums:Int*):Int={
    if(nums.length==0){
      0
    }else{
      nums.head + sum(nums.tail:_*)
    }
  }
  println(sum())
  println(sum(1,2,3,4))

set
可变set:scala.collection.mutable.Set
用法与list一样 数据不重复

Map
Map(映射)是一种可迭代的键值对(key/value)结构。

所有的值都可以通过键来获取。

Map 中的键都是唯一的。

Map 也叫哈希表(Hash tables)。

Map 有两种类型,可变与不可变,区别在于可变对象可以修改它,而不可变对象不可以。

默认情况下 Scala 使用不可变 Map。如果你需要使用可变集合,你需要显式的引入 import scala.collection.mutable.Map 类

在 Scala 中 你可以同时使用可变与不可变 Map,不可变的直接使用 Map,可变的使用 mutable.Map。以下实例演示了不可变 Map 的应用:

// 空哈希表,键为字符串,值为整型
var A:Map[Char,Int] = Map()

// Map 键值对演示
val colors = Map(“red” -> “#FF0000”, “azure” -> “#F0FFFF”)
定义 Map 时,需要为键值对定义类型。如果需要添加 key-value 对,可以使用 + 号,如下所示:

A += (‘I’ -> 1)
A += (‘J’ -> 5)
A += (‘K’ -> 10)
A += (‘L’ -> 100)

object Test {
   def main(args: Array[String]) {
      val colors = Map("red" -> "#FF0000",
                       "azure" -> "#F0FFFF",
                       "peru" -> "#CD853F")

      val nums: Map[Int, Int] = Map()

      println( "colors 中的键为 : " + colors.keys )
      println( "colors 中的值为 : " + colors.values )
      println( "检测 colors 是否为空 : " + colors.isEmpty )
      println( "检测 nums 是否为空 : " + nums.isEmpty )
   }
}

keys 返回 Map 所有的键(key)
values 返回 Map 所有的值(value)
isEmpty 在 Map 为空时返回true
Map 合并
你可以使用 ++ 运算符或 Map.++() 方法来连接两个 Map,Map 合并时会移除重复的 key。以下演示了两个 Map 合并的实例:

object Test {
def main(args: Array[String]) {
val colors1 = Map(“red” -> “#FF0000”,
“azure” -> “#F0FFFF”,
“peru” -> “#CD853F”)
val colors2 = Map(“blue” -> “#0033FF”,
“yellow” -> “#FFFF00”,
“red” -> “#FF0000”)

  //  ++ 作为运算符
  var colors = colors1 ++ colors2
  println( "colors1 ++ colors2 : " + colors )

  //  ++ 作为方法
  colors = colors1.++(colors2)
  println( "colors1.++(colors2)) : " + colors )

}
}
执行以上代码,输出结果为:

$ scalac Test.scala
$ scala Test
colors1 ++ colors2 : Map(blue -> #0033FF, azure -> #F0FFFF, peru -> #CD853F, yellow -> #FFFF00, red -> #FF0000)
colors1.++(colors2)) : Map(blue -> #0033FF, azure -> #F0FFFF, peru -> #CD853F, yellow -> #FFFF00, red -> #FF0000)
输出 Map 的 keys 和 values
以下通过 foreach 循环输出 Map 中的 keys 和 values:

object Test {
def main(args: Array[String]) {
val sites = Map(“runoob” -> “http://www.runoob.com”,
“baidu” -> “http://www.baidu.com”,
“taobao” -> “http://www.taobao.com”)

  sites.keys.foreach{ i =>  
                       print( "Key = " + i )
                       println(" Value = " + sites(i) )}

}
}
查看 Map 中是否存在指定的 Key
你可以使用 Map.contains 方法来查看 Map 中是否存在指定的 Key。实例如下:

object Test {
def main(args: Array[String]) {
val sites = Map(“runoob” -> “http://www.runoob.com”,
“baidu” -> “http://www.baidu.com”,
“taobao” -> “http://www.taobao.com”)

  if( sites.contains( "runoob" )){
       println("runoob 键存在,对应的值为 :"  + sites("runoob"))
  }else{
       println("runoob 键不存在")
  }
  if( sites.contains( "baidu" )){
       println("baidu 键存在,对应的值为 :"  + sites("baidu"))
  }else{
       println("baidu 键不存在")
  }
  if( sites.contains( "google" )){
       println("google 键存在,对应的值为 :"  + sites("google"))
  }else{
       println("google 键不存在")
  }

}
}
执行以上代码,输出结果为:

$ scalac Test.scala
$ scala Test
runoob 键存在,对应的值为 :http://www.runoob.com
baidu 键存在,对应的值为 :http://www.baidu.com
google 键不存在

option&Some&None
Option类型代表任意的值,多用在集合操作中,它可以存储任意类型的值,Option实例就是Some或者None对象实例,Some和None都是它的子类,他们都是final类,所以不能再有派生子类了
Option类型数据可以使用大部分的集合操作,可参考 Array(集合、序列)
Option数据存取其实是对Some对象的操作,看下面代码

val a = Array(10,20,"30","40")
val b = a.lastOption
println(b)      // Some(40)

a是一个集合,lastOption返回最后一个Option类型对象,lastOption的代码在TraversableLike.scala中

def lastOption: Option[A] = if (isEmpty) None else Some(last)
last方法



 def last: A = {
    var lst = head
    for (x <- this)
      lst = x
    lst
  }

head方法

  def head: A = {
    var result: () => A = () => throw new NoSuchElementException
    breakable {
      for (x <- this) {
        result = () => x
        break
      }
    }
    result()
  }

lastOption方法中将通过last取到的最后一个元素转换为Some类型了,Some是Option的子类,所以返回结果是Option类型,那看看Some的代码

final case class Some[+A](x: A) extends Option[A] {
  def isEmpty = false
  def get = x
}

它实现了Option的get接口

def get: A
返回了传入的参数 x,所以如果我们遇到Option类型对象,就可以通过它的get方法取得实际元素的值,如:

a.lastOption.get
除了Some类型外,如果集合中是空的,那么操作返回None类型

case object None extends Option[Nothing] {
  def isEmpty = true
  def get = throw new NoSuchElementException("None.get")
}

比如Option中的map方法

  @inline final def map[B](f: A => B): Option[B] =
    if (isEmpty) None else Some(f(this.get))

也就是Option类型只会返回Some或None类型对象

Tuple

object MapTest {

  def main(args: Array[String]): Unit = {

    // 元组:Tuple,就是由()包起来,和数据库中一条记录概念类似
    val t1 = (1,2)
    println(t1)
    println(t1._1) // 获取tuple第一个元素
    println(t1._2) // 获取tuple第二个元素

    val t2 = (1,"xiaoming","男",23,"高新区")
    println(t2)

    val a = List(1,2,3,4)
    // Tuple举列:求List中a的长度,元素求和,元素的平方和
    // 设计成一个tuple(长度, 元素求和, 元素平方和)
    def sumSq(in:List[Int]):(Int,Int,Int) = in.foldLeft((0,0,0))((t,v) => (t._1+1,t._2+v,t._3+v*v))
    println(sumSq(a))

    // Map<K,V>
    val map1 = Map(1 -> "david", 3 -> "lisa")
    println(map1(1))  // 根据key获取value
    println(map1(3))  // 根据key获取value
    println(map1.contains(1)) // 判断Map中包含某个元素
    println(map1.keys) // 获取map中所有的key
    println(map1.values) // 获取map中所有的values
    map1 + (2 -> "xiaoming") // 向map中添加一个元素
    map1 - 3    // 向map中删除一个元素
    map1 ++ List(4 -> "xiaohuang",5 -> "xiaoliu")  // 向map添加多个元素
    map1 -- List(1,2)  // 向map删除多个元素

  }
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值