1、JAVA
2、计算机网络
3、计算机体系结构
4、数据库
5、计算机组成原理
6、软件工程
7、大数据
8、英文 自我介绍
七、大数据
- Spark
1. 什么是 Spark?Spark 的核心组件是什么?
Spark 是一个开源的大数据处理框架,它的核心组件包括 Spark Core、Spark SQL、Spark Streaming、Spark MLlib 和 Spark GraphX。
2. Spark 和 Hadoop 的区别是什么?
Spark 和 Hadoop 的主要区别在于两者处理数据的方式和目标不同。Hadoop 旨在处理大量静态数据,而 Spark 旨在处理实时数据、流式数据和迭代计算。
3. Spark 的核心是什么?
Spark 的核心是 Spark Core,它提供了分布式数据处理的核心功能,包括分布式数据集 RDD、基于DAG 的任务调度、内存计算、分布式文件系统支持等。
4. 什么是 RDD?它有什么特性和限制?
RDD(Resilient Distributed Dataset)是 Spark 的基本数据结构,具有不可变性、容错性和分区性等特性,但是也有一些限制,如只能使用内存作为存储介质,不支持数据更新等。
5. Spark 的五种基本操作是什么?
Spark 的五种基本操作包括转换操作、