自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(18)
  • 收藏
  • 关注

原创 Linux网络实战(二)- WWW服务器搭建

本关任务是学会如何在线安装。服务(实验环境使用的是。本关任务是学会如何配置。

2024-06-03 20:30:39 1144

原创 Linux网络实战(一)- DNS配置

在右侧命令行中配置本地主机名与。本关任务是学会如何启动/关闭。本关任务是学会如何在线安装。IP地址相绑定在一起。

2024-06-02 21:15:15 657

原创 Linux 远程联机服务(二)- Rsh服务器

服务器软件(实验环境使用的是。客户端软件(实验环境使用的是。在右侧命令行中完成在线安装。服务器软件和客户端软件。服务(实验环境使用的是。目录下新创建一个文件。

2024-06-02 20:22:04 867

原创 Linux 远程联机服务(一)- Telnet服务器

服务器软件(实验环境使用的是。客户端软件(实验环境使用的是。在右侧命令行中在线安装。服务(实验环境使用的是。目录下新创建一个文件。

2024-06-01 20:59:03 499

原创 Linux之用户高级管理

根据右侧窗口命令行内的提示,在。根据右侧窗口命令行内的提示,在。根据右侧窗口命令行内的提示,在。

2024-06-01 20:43:24 336

原创 Linux之用户管理

根据右侧窗口命令行内的提示,在。根据右侧窗口命令行内的提示,在。根据右侧窗口命令行内的提示,在。

2024-06-01 20:39:09 533

原创 套接字流实现黑名单过滤

本关任务:本关是利用套接字流监听方法,监听名单信息并过滤黑名单信息。首先需要模拟名单的生成,首先需要建一个文档,每行为一个姓名。然后编写代码,当有指定套接字连接产生时,从文件中依次选取所有名单,发送给套接字端口。另外在编写代码,通过连接套接字端口,监听端口的数据,获取发送的名单,并过滤黑名单。名单文档内容如下: Jim Mary Tom Jack Abby Bee Belle Babs Carla Dale Dan Gary Ken Jane Paige。根据提示,补充监听套接字并过滤黑名单代码文。

2024-05-31 19:14:16 350

原创 章节测验.

文件,并填充 Python 语句完成右侧代码文件中列出的所有操作。打开右侧代码文件窗口,在。区域补充代码,完成任务。打开右侧代码文件窗口,在。区域补充代码,完成任务。打开右侧代码文件窗口,在。区域补充代码,完成任务。读取 MySQL 数据库。

2024-05-31 19:11:47 994

原创 章节测验()

文本文件 RDD 可以使用创建 SparkContext 的textFile 方法。此方法需要一个 URI的 文件(本地路径的机器上,或一个hdfs://,s3a://等URI),并读取其作为行的集合。# 3.使用 rdd.collect() 收集 rdd 的内容。rdd.collect() 是 Spark Action 算子,在后续内容中将会详细说明,主要作用是:收集 rdd 的数据内容。# 1.初始化 SparkContext,该对象是 Spark 程序的入口。# 4.打印 rdd 的内容。

2024-05-31 19:04:17 306

原创 Transformation - mapPartitions

【代码】Transformation - mapPartitions。

2024-05-31 18:57:16 185

原创 Transformation - map

【代码】Transformation - map。

2024-05-31 18:56:14 228

原创 章节测验(文件)

请你读取这三个文件的内容,计算各个学生的平均成绩(保留两位小数),将输出结果存储到。其中每行存储的内容由两个字段组成,第一个是学生名字,第二个是学生的成绩。,现在需要对这两个文件进行合并,并剔除其中重复的内容,将合并结果存储到。本关任务:根据编程要求,完成任务。本关任务:根据编程要求,完成任务。输出结果按平均分成绩降序进行排列。下面是上述文件一个样例,供参考。合并结果按首列升序进行排列。打开右侧代码文件窗口,在。区域补充代码,完成任务。打开右侧代码文件窗口,在。区域补充代码,完成任务。

2024-05-31 18:51:57 410

原创 读取外部数据集创建RDD

PySpark可以从Hadoop支持的任何存储源创建分布式数据集,包括本地文件系统,HDFSCassandraHBaseAmazon S3等。Spark支持文本文件,和任何其他。文本文件RDD可以使用创建的textFile方法。此方法需要一个URI的文件(本地路径的机器上,或一个等 URI),并读取其作为行的集合。这是一个示例调用:# 1.初始化 SparkContext,该对象是 Spark 程序的入口。

2024-05-31 18:06:57 284

原创 集合并行化创建RDD

RDD)叫做分布式数据集,是Spark中最基本的数据抽象,它代表一个不可变可分区、里面的元素可并行计算的集合。RDD具有数据流模型的特点:自动容错、位置感知性调度和可伸缩性。RDD允许用户在执行多个查询时显式地将工作集缓存在内存中,后续的查询能够重用工作集,这极大地提升了查询速度。简单的来说RDD就是一个集合,一个将集合中数据存储在不同机器上的集合。# 1.初始化 SparkContext,该对象是 Spark 程序的入口# 2.创建一个1到8的列表List。

2024-05-31 18:05:43 346

原创 数据data.

为了让数据变得可用,需要对数据进行三个步骤的处理,分别是( )计算机系统中的数据组织形式主要有两种,分别是( )下面关于数据的说法,错误的是( )数据的价值会因为不断使用而削减。数据的类型主要包括()

2024-05-25 21:13:44 249

原创 大数据测验(二)

大数据产业是指一切与支撑大数据组织管理和价值发现相关的企业经济活动的集合。以下哪些属于大数据产业的某个环节( )具备强大的并发性,支持函数式编程,可以更好地支持分布式系统。Scala 兼容 Java,可以与 Java 互操作。语法简洁,且强制缩格,程序具有很好的可读性。Scala 具有诸多优点,主要包括( )以下哪个不是大数据的“4V”特性( )Python 的主要优点包括( )Scala 支持高效的交互式编程。Scala 代码简洁优雅。可以使用多种执行方式。

2024-05-25 21:10:23 214

原创 大数据测验

物联网的发展最终导致了人类社会数据量的第三次跃升,使得数据产生方式进入了( )信息科技为大数据时代提供技术支撑,主要体现在哪三个方面( )紧抓大数据产业机遇,应对脱欧后的经济挑战。云计算、大数据和物联网技术的普及。第3次信息化浪潮的标志是( )英国的大数据发展战略是( )CPU处理能力大幅提升。存储设备容量不断增加。

2024-05-25 21:07:57 200

原创 Spark任务提交

本关任务:学会将程序提交到集群上执行。为了完成本关任务,你需要掌握:1.了解。

2024-05-24 15:51:01 257

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除