目录
Spark是专为大规模数据处理而设计的快速通用的计算引擎,它是由Scala语言开发实现的。
1.1 Scala概述
Spark是专为大规模数据处理而设计的快速通用的计算引擎,它是由Scala语言开发实现的,关于大数据技术,本身就是计算数据,而Scala既有面向对象组织项目工程的能力,又具备计算数据的功能,同时Spark和Scala的紧密集成,本书将采用Scala语言开发Spark程序,所以学好Scala将有助于我们更好的掌握Spark框架。
Scala是Scalable Language的简称,它是一门多范式的编程语言,其设计初衷是实现可伸缩的语言、并集成面向对象编程和函数式编程的各种特性。具体如下:
- Scala是面向对象的
Scala是一种纯粹的面向对象语言,每一个值都是一个对象。对象的数据类型以及行为由类的特征来描述。
- Scala是函数式编程的
Scala也是一种函数式语言,其函数可以作为值来使用。
- Scala是静态类型的
Scala具备类型系统,通过编译时检查,保证代码的安全性和一致性。
- Scala是可扩展的
Scala提供了许多独特的语言机制,它以库的方式能够轻易无缝添加新的语言结构 。
- Scala是可交互操作的
Scala旨在与流行的Java进行良好的交互操作。Scala用Scala编译器把源文件编译成Java的class文件。我们可以从中调用Java类库,也同样可以从Java应用程序中调用Scala的代码。
1.1.1 Scala的下载安装
Scala语言可以运行在Windows、Linux、Mac OS等系统上。由于Scala是运行在JVM平台上的,所以安装Scala之前必须配置好JDK环境(JDK版本要求不低于1.5版本)。本书使用的JDK版本是jdk1.8。
1. 在Windows下安装Scala
访问Scala官网