Scala
文章平均质量分 65
傍ྂ离ྂ
最最最最菜的见习烫头程序猿
展开
-
Spark RDD&算子 基本操作
1.RDD Spark提供了两种创建RDD的方式: (1)由一个已经存在的Scala集合进行创建。 (2)由外部存储系统的数据集创建,包括本地的文件系统,还有所有Hadoop支持的数据集,比如HDFS、Cassandra、HBase等。 1.1读取文件 textFile() val rdd = sc.textFile("/home/student.txt")//文件路径 1.2集合创建RDD Spark会将集合中的数据拷贝到集群上去,形成一个分布式的数据集合,也就是一个RDD。相当于是,集合中的部分数据原创 2021-04-15 15:39:27 · 594 阅读 · 0 评论 -
Scala求航班机票价格平均值和极值
题目 通过网络获取济南到北京、上海、广州、深圳、重庆、西安的近30天的航班票价,统计出平均值、最大值、最小值,按如下格式输出 济南–北京 平均值 最大值/时间 最小值/时间 济南–上海 平均值 最大值/时间 最小值/时间 济南–广州 平均值 最大值/时间 最小值/时间 济南–深圳 平均值 最大值/时间 最小值/时间 济南–重庆 平均值 最大值/时间 最小值/时间 济南–西安 平均值 最大值/时间原创 2021-04-02 17:15:05 · 715 阅读 · 1 评论 -
Scala容器操作
题目 现有文档1–文档6共6份文档,每份文档中包含若干内容,要求如下: 1、从所有文档中提取出包含关键字的所有行,要统计的关键字为: 网络暴力 广告 日本央行 土耳其 加息 美国 比特币 新冠 2、统计每个关键字出现的总次数 3、以如下形式输出: 关键字 (行1/行2/行3/…) 关键字总计出现次数 代码 import java.io.File import scala.collection.mutable.ArrayBuffer import scala.io.Source import s原创 2021-03-26 20:40:26 · 506 阅读 · 0 评论