目录
1.使用 Apache Spark 的 Scala API 创建一个 SparkSession 对象
3.对 DataFrame 进行聚合操作,计算了订单数据的总销售金额、平均订单金额、最大订单金额、最小订单金额以及订单的总数量。
前言
随着如今大数据时代的来临,各种各样的大数据铺面而来,我们急需一种技术来解决这个难题。下面我就制作了一个简单的SCALA程序来处理电子商务订单数据,来获取我们需要查找和统计的数据。
一、SCALA是什么?
Scala 是一种多范式编程语言,它结合了面向对象编程和函数式编程的特性。Scala 运行在 Java 虚拟机(JVM)上,因此可以与 Java 无缝集成,并且可以利用 Java 生态系统中丰富的库和工具。Scala 旨在提供更简洁、高效的编程语言,同时具备强大的表达能力和灵活性。
由于Scala编译后得到Java字节码,所以Scala和Java本质上是一个东西,Scala和Java类可以相互调用。
二、SCALA使用步骤
1.windows 安装 SCALA
1.将scala-2.11.12.zip解压到某个路径,并配置SCALA_HOME和path环境变量
验证是否部署成功:
2.安装SCALA插件