- 博客(2)
- 资源 (22)
- 问答 (5)
- 收藏
- 关注
原创 大数据——粗谈Hadoop生态系统
首先,我们来介绍一下什么是Hadoop。 Hadoop最核心的部件有两个,一为HDFS,所谓的HDFS,就是分布式的文件存储系统。 二为Mapreduce,即为分布式的计算系统(分布式离线的计算框架)。 上述的两个部件,解决了大数据的存储问题,还有解决了大数据的计算问题。 剩下的基本上都是这两个所衍生出来的工具。 Maperduce的编程语言: 1、Jave(最原始的方...
2019-10-24 20:56:37 3617 1
原创 大数据——粗谈Apache Spark(计算引擎)
Spark产生的原因: 1、MapReduce具有很多的局限性,仅支持Map和Reduce两种操作,还有迭代效率比较低,不适合交互式的处理,不擅长流式处理。 2、现有的各种计算框架各自为战。 Spark就是在一个统一的框架下能够进行批处理,流式计算和交互式计算。 Spark的核心概念就是RDD(弹性分布式数据集)分布在集群中的对象集合,存储在磁盘或内存中。通过并行“转换”操作构造,失...
2019-10-24 20:56:21 3362 1
关于STM32的晶振使用问题
2023-07-04
关于二进制左移的问题
2022-05-23
关于Micro python的问题
2022-04-28
python关于|的问题
2022-04-03
问一下当SW1开关按下问什么是低电平?
2021-05-11
在STM32中的I2C接口中,其是否含有硬件信息错误检测单元(PEC)?
2020-08-04
TA创建的收藏夹 TA关注的收藏夹
TA关注的人