Scala基础--(上篇)

最新推荐文章于 2023-03-20 08:20:42 发布

小哪吒的BD

最新推荐文章于 2023-03-20 08:20:42 发布

阅读量869

点赞数 3

分类专栏：大数据 scala

本文链接：https://blog.csdn.net/Mr_Yang888/article/details/105184766

版权

大数据同时被 2 个专栏收录

56 篇文章 0 订阅

订阅专栏

scala

7 篇文章 0 订阅

订阅专栏

Scala基础

想学好scala，就必须先打好基础。正所谓 “ 倘想达到最高处，就要从低处开始”。没有人是生来就是某个领域的专家。所谓的专家，不过是把基础反复的加固，花在那个领域的时间比平常人下的功夫比别人多一些而已。李小龙说过：“我不怕练了一万种招式的人，却怕把一招练了一万遍的人”。所以说，想学好某件事，就要从打牢基础做起。好了，废话不多说，开始进入正题。
在这里插入图片描述

文章目录

Scala基础

1、变量

1.1 、语法格式

在scala中，可以使用val或者var来定义变量，语法格式如下:

val/var 变量标识:变量类型 = 初始值

示例：
在scala解释器中定义一个变量

scala> val name:String = "tom"
name: String = tom

其中

val定义的是不可重新赋值的变量
var- 定义的是可重新赋值的变量

注意：

scala中定义变量类型写在变量名后面
scala的语句不需要添加分号

1.2、使用类型推断来定义变量

scala的语法要比Java简洁，我们可以使用一种更简洁的方式来定义变量。

示例
使用更简洁的语法定义一个变量保存一个人的名字"tom"

参考代码

scala> val name = "tom"
name: String = tom

1.3、惰性赋值

在企业的大数据开发中，有时候会编写非常复杂的SQL语句，这些SQL语句可能有几百行甚至上千行。这些SQL语句，如果直接加载到JVM中，会有很大的内存开销。如何解决？

当有一些变量保存的数据较大时，但是不需要马上加载到JVM内存。可以使用惰性赋值来提高效率。

语法格式：

lazy val/var 变量名 = 表达式

示例
在程序中需要执行一条以下复杂的SQL语句，我们希望只有用到这个SQL语句才加载它。

"""insert overwrite table adm.itcast_adm_personas
    select
    a.user_id,
    a.user_name,
    a.user_sex,
    a.user_birthday,
    a.user_age,
    a.constellation,
    a.province,
    a.city,
    a.city_level,
    a.hex_mail,
    a.op_mail,
    a.hex_phone,
    a.fore_phone,
    a.figure_model,
    a.stature_model,
    b.first_order_time,
    b.last_order_time,
      ...
    d.month1_hour025_cnt,
    d.month1_hour627_cnt,
    d.month1_hour829_cnt,
    d.month1_hour10212_cnt,
    d.month1_hour13214_cnt,
    d.month1_hour15217_cnt,
    d.month1_hour18219_cnt,
    d.month1_hour20221_cnt,
    d.month1_hour22223_cnt
    from gdm.itcast_gdm_user_basic a
      left join gdm.itcast_gdm_user_consume_order b on a.user_id=b.user_id
    left join gdm.itcast_gdm_user_buy_category c on a.user_id=c.user_id
    left join gdm.itcast_gdm_user_visit d on a.user_id=d.user_id;"""

参考代码

scala> lazy val sql = """insert overwrite table adm.itcast_adm_personas
     |     select
     |     a.user_id,
	....
     |     left join gdm.itcast_gdm_user_buy_category c on a.user_id=c.user_id
     |     left join gdm.itcast_gdm_user_visit d on a.user_id=d.user_id;"""
sql: String = <lazy>

2、字符串

scala提供多种定义字符串的方式，将来我们可以根据需要来选择最方便的定义方式。

使用双引号
使用插值表达式
使用三引号

2.1、使用双引号

语法：

val/var 变量名 = “字符串”

示例
有一个人的名字叫"hadoop"，请打印他的名字以及名字的长度。
参考代码

scala> println(name + name.length)
hadoop6

2.2、使用插值表达式

scala中，可以使用插值表达式来定义字符串，有效避免大量字符串的拼接。

语法

val/var 变量名 = s"${变量/表达式}字符串"

注意：

在定义字符串之前添加s
在字符串中，可以使用${}来引用变量或者编写表达式

示例
请定义若干个变量，分别保存：“zhangsan”、30、“male”，定义一个字符串，保存这些信息。

打印输出：name=zhangsan, age=30, sex=male
参考代码

scala> val name = "zhangsan"
name: String = zhangsan

scala> val age = 30
age: Int = 30

scala> val sex = "male"
sex: String = male

scala> val info = s"name=${name}, age=${age}, sex=${sex}"
info: String = name=zhangsan, age=30, sex=male

scala> println(info)
name=zhangsan, age=30, sex=male

2.3、使用三引号

如果有大段的文本需要保存，就可以使用三引号来定义字符串。例如：保存一大段的SQL语句。三个引号中间的所有字符串都将作为字符串的值。

语法

val/var 变量名 = """字符串1
字符串2"""

示例
定义一个字符串，保存以下SQL语句

select
	*
from
    t_user
where
    name = "zhangsan"

参考代码

val sql = """select
     | *
     | from
     |     t_user
     | where
     |     name = "zhangsan""""

println(sql)

3、数据类型与操作符

3.1、数据类型

基础类型	类型说明
Byte	8位带符号整数
Short	16位带符号整数
Int	32位带符号整数
Long	64位带符号整数
Char	16位无符号Unicode字符
String	Char类型的序列（字符串）
Float	32位单精度浮点数
Double	64位双精度浮点数
Boolean	true或false

注意下 scala类型与Java的区别

scala中所有的类型都使用大写字母开头
整形使用Int而不是Integer
scala中定义变量可以不写类型，让scala编译器自动推断

3.2、运算符

类别	操作符
算术运算符	+、-、*、/
关系运算符	>、<、==、!=、>=、<=
逻辑运算符	&&、\|\|、!
位运算符	&、\|\|、^、<<、>>

注意

scala中没有，++、–运算符

与Java不一样，在scala中，可以直接使用==、!=进行比较，它们与equals方法表示一致。而比较两个对象的引用值，使用eq

示例
有一个字符串"abc"，再创建第二个字符串，值为：在第一个字符串后拼接一个空字符串。

然后使用比较这两个字符串是否相等、再查看它们的引用值是否相等。

参考代码

val str1 = "abc"
val str2 = str1 + ""
str1 == str2
str1.eq(str2)

3.3、scala类型层次结构

在这里插入图片描述

类型	说明
Any	所有类型的父类，,它有两个子类AnyRef与AnyVal
AnyVal	所有数值类型的父类
AnyRef	所有对象类型（引用类型）的父类
Unit	表示空，Unit是AnyVal的子类，它只有一个的实例{% em %}() {% endem %} 它类似于Java中的void，但scala要比Java更加面向对象
Null	Null是AnyRef的子类，也就是说它是所有引用类型的子类。它的实例是{% em %}null{% endem %} 可以将null赋值给任何对象类型
Nothing	所有类型的子类不能直接创建该类型实例，某个方法抛出异常时，返回的就是Nothing类型，因为Nothing是所有类的子类，那么它可以赋值为任何类型

4、条件表达式

条件表达式就是if表达式，if表达式可以根据给定的条件是否满足，根据条件的结果（真或假）决定执行对应的操作。scala条件表达式的语法和Java一样。

4.1、有返回值的if

与Java不一样的是，

[!NOTE]

在scala中，条件表达式也是有返回值的
在scala中，没有三元表达式，可以使用if表达式替代三元表达式

示例
定义一个变量sex，再定义一个result变量，如果sex等于"male"，result等于1，否则result等于0
参考代码

scala> val sex = "male"
sex: String = male

scala> val result = if(sex == "male") 1 else 0
result: Int = 1

4.2、块表达式

scala中，使用{}表示一个块表达式
和if表达式一样，块表达式也是有值的
值就是最后一个表达式的值

示例：
解释器中执行以下代码

scala> var a ={
     | println("1+1")
     | 1+1
     | }
     
1+1
a: Int = 2

5、循环

在scala中，可以使用for和while，但一般推荐使用for表达式，因为for表达式语法更简洁

5.1、for表达式

语法

for(i <- 表达式/数组/集合) {
    // 表达式
}

5.1.1、简单循环

使用for表达式打印1-10的数字
步骤

生成1-10的数字（提示：使用to方法）
使用for表达式遍历，打印每个数字

参考代码

scala> val nums = 1.to(10)                                                              
nums: scala.collection.immutable.Range.Inclusive = Range(1, 2, 3, 4, 5, 6, 7, 8, 9, 10) 
                                                                                        
scala> for(i <- nums) println(i)

简写方式
参考代码2

// 中缀调用法
scala> for(i <- 1 to 10) println(i)

5.1.2、简单循环

使用for表达式，打印3行5列的*型矩阵

步骤

使用for表达式打印3行，5列星星
每打印5个星星，换行
参考代码

for(i <- 1 to 3; j <- 1 to 5) {print("*");if(j == 5) println("")}

5.1.3、守卫

for表达式中，可以添加if判断语句，这个if判断就称之为守卫。我们可以使用守卫让for表达式更简洁。
语法

for(i <- 表达式/数组/集合 if 表达式) {
    // 表达式
}

示例
使用for表达式打印1-10之间能够整除3的数字
参考代码

// 添加守卫，打印能够整除3的数字
for(i <- 1 to 10 if i % 3 == 0) println(i)

5.1.4、 for推导式

将来可以使用for推导式生成一个新的集合（一组数据）
在for循环体中，可以使用yield表达式构建出一个集合，我们把使用yield的for表达式称之为推导式

示例

生成一个10、20、30…100的集合

参考代码

// for推导式：for表达式中以yield开始，该for表达式会构建出一个集合
val v = for(i <- 1 to 10) yield i * 10

5.2、while循环

scala中while循环和Java中是一致的

示例

打印1-10的数字

参考代码

scala> var i = 1
i: Int = 1

scala> while(i <= 10) {
     | println(i)
     | i = i+1
     | }

6、break和continue

在scala中，类似Java和C++的break/continue关键字被移除了
如果一定要使用break/continue，就需要使用scala.util.control包的Break类的breable和break方法。

6.1、实现break

用法

导入Breaks包import scala.util.control.Breaks._
使用breakable将for表达式包起来
for表达式中需要退出循环的地方，添加break()方法调用

示例

使用for表达式打印1-100的数字，如果数字到达50，退出for表达式

参考代码

// 导入scala.util.control包下的Break
import scala.util.control.Breaks._

breakable{
    for(i <- 1 to 100) {
        if(i >= 50) break()
        else println(i)
    }
}

6.2、实现break

用法

continue的实现与break类似，但有一点不同：

[!NOTE]

实现break是用breakable{}将整个for表达式包起来，而实现continue是用breakable{}将for表达式的循环体包含起来就可以了

示例

打印1-100的数字，使用for表达式来遍历，如果数字能整除10，不打印

// 导入scala.util.control包下的Break    
import scala.util.control.Breaks._

for(i <- 1 to 100 ) {
    breakable{
        if(i % 10 == 0) break()
        else println(i)
    }
}

7、方法

一个类可以有自己的方法，scala中的方法和Java方法类似。但scala与Java定义方法的语法是不一样的。

7.1、定义方法

语法

def methodName (参数名:参数类型, 参数名:参数类型) : [return type] = {
    // 方法体：一系列的代码
}

[!NOTE]

参数列表的参数类型不能省略
返回值类型可以省略，由scala编译器自动推断
返回值可以不写return，默认就是{}块表达式的值

示例

定义一个方法，实现两个整形数值相加，返回相加后的结果
调用该方法

参考代码

scala> def add(a:Int, b:Int) = a + b
m1: (x: Int, y: Int)Int

scala> add(1,2)
res10: Int = 3

7.2、返回值类型推断

scala定义方法可以省略返回值，由scala自动推断返回值类型。这样方法定义后更加简洁。

[!DANGER]

定义递归方法，不能省略返回值类型

示例

定义递归方法（求阶乘）

10 * 9 * 8 * 7 * 6 * … * 1

参考代码

scala> def m2(x:Int) = {
     | if(x<=1) 1
     | else m2(x-1) * x
     | }
<console>:13: error: recursive method m2 needs result type
       else m2(x-1) * x

7.3、方法参数

scala中的方法参数，使用比较灵活。它支持以下几种类型的参数：

默认参数
带名参数
变长参数

7.3.1、默认参数

在定义方法时可以给参数定义一个默认值。

示例

定义一个计算两个值相加的方法，这两个值默认为0
调用该方法，不传任何参数

参考代码

// x，y带有默认值为0 
def add(x:Int = 0, y:Int = 0) = x + y
add()

7.3.2、带名参数

在调用方法时，可以指定参数的名称来进行调用。

示例

定义一个计算两个值相加的方法，这两个值默认为0
调用该方法，只设置第一个参数的值

参考代码

def add(x:Int = 0, y:Int = 0) = x + y
add(x=1)

7.3.3、变长参数

如果方法的参数是不固定的，可以定义一个方法的参数是变长参数。

语法格式：

def 方法名(参数名:参数类型*):返回值类型 = {
    方法体
}

[!NOTE]

在参数类型后面加一个*号，表示参数可以是0个或者多个

示例

定义一个计算若干个值相加的方法
调用方法，传入以下数据：1,2,3,4,5

参考代码

scala> def add(num:Int*) = num.sum
add: (num: Int*)Int

scala> add(1,2,3,4,5)
res1: Int = 15

7.4、方法调用方式

在scala中，有以下几种方法调用方式，

后缀调用法
中缀调用法
花括号调用法
无括号调用法

在后续编写spark、flink程序时，我们会使用到这些方法调用方式。

7.4.1、后缀调用法

这种方法与Java没有区别。
语法

对象名.方法名(参数)

示例

使用后缀法Math.abs求绝对值

参考代码

scala> Math.abs(-1)
res3: Int = 1

7.4.2、中缀调用法

语法

对象名 方法名 参数

[!TIP]
如果有多个参数，使用括号括起来

示例

使用中缀法Math.abs求绝对值

scala> Math abs -1
res4: Int = 1

7.4.3、操作符即方法

来看一个表达式

1 + 1

大家觉得上面的表达式像不像方法调用？

在scala中，+ - * / %等这些操作符和Java一样，但在scala中，

所有的操作符都是方法
操作符是一个方法名字是符号的方法

7.4.4、花括号调用法

语法

Math.abs{ 
    // 表达式1
    // 表达式2
}

[!DANGER]

方法只有一个参数，才能使用花括号调用法

示例

使用花括号调用法Math.abs求绝对值

参考代码

scala> Math.abs{-10}
res13: Int = 10

7.4.5、无括号调用法

如果方法没有参数，可以省略方法名后面的括号

示例

定义一个无参数的方法，打印"hello"
使用无括号调用法调用该方法

参考代码

def m3()=println("hello")
m3()

8、函数

scala支持函数式编程，将来编写Spark/Flink程序中，会大量使用到函数

8.1、定义函数

语法

val 函数变量名 = (参数名:参数类型, 参数名:参数类型....) => 函数体

[!TIP]

函数是一个对象（变量）
类似于方法，函数也有输入参数和返回值
函数定义不需要使用def定义
无需指定返回值类型
示例

定义一个两个数值相加的函数
调用该函数

参考代码

scala> val add = (x:Int, y:Int) => x + y
add: (Int, Int) => Int = <function2>

scala> add(1,2)
res3: Int = 3

8.2、方法和函数的区别

方法是隶属于类或者对象的，在运行时，它是加载到JVM的方法区中
可以将函数对象赋值给一个变量，在运行时，它是加载到JVM的堆内存中
函数是一个对象，继承自FunctionN，函数对象有apply，curried，toString，tupled这些方法。方法则没有

示例

方法无法赋值给变量

scala> def add(x:Int,y:Int)=x+y
add: (x: Int, y: Int)Int

scala> val a = add
<console>:12: error: missing argument list for method add
Unapplied methods are only converted to functions when a function type is expected.
You can make this conversion explicit by writing `add _` or `add(_,_)` instead of `add`.
       val a = add

8.3、方法转换为函数

有时候需要将方法转换为函数，作为变量传递，就需要将方法转换为函数
使用_即可将方法转换为函数

示例

定义一个方法用来进行两个数相加
将该方法转换为一个函数，赋值给变量

参考代码

scala> def add(x:Int,y:Int)=x+y
add: (x: Int, y: Int)Int

scala> val a = add _
a: (Int, Int) => Int = <function2>

好了，本篇文章内容就到这里就结束了。但这只是上篇哦，小编会继续更新关于scala的篇章哦，请各位读者敬请期待哦。我们下期见~~~
我是小哪吒。一名编程行业的业余选手…哈哈哈

除了你自己，没人能让你放弃，加油~~~

小哪吒的BD

关注

3
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

Scala基础--(上篇)

Scala基础

文章目录

1、变量

1.1 、语法格式

1.2、使用类型推断来定义变量

1.3、惰性赋值

2、字符串

2.1、使用双引号

2.2、使用插值表达式

2.3、使用三引号

3、数据类型与操作符

3.1、数据类型

3.2、运算符

3.3、scala类型层次结构

4、条件表达式

4.1、有返回值的if

4.2、块表达式

5、循环

5.1、for表达式

5.1.1、 简单循环

5.1.2、 简单循环

5.1.3、 守卫

5.1.4、 for推导式

5.2、while循环

6、break和continue

6.1、实现break

6.2、实现break

7、方法

7.1、定义方法

7.2、返回值类型推断

7.3、方法参数

7.3.1、默认参数

7.3.2、带名参数

7.3.3、变长参数

7.4、方法调用方式

7.4.1、后缀调用法

7.4.2、中缀调用法

7.4.3、操作符即方法

7.4.4、花括号调用法

7.4.5、无括号调用法

8、函数

8.1、定义函数

8.2、方法和函数的区别

8.3、方法转换为函数

5.1.1、简单循环

5.1.2、简单循环

5.1.3、守卫