- 博客(2)
- 收藏
- 关注
原创 大数据生态系统
1、Hadoop 是一个由Apache 基金会所开发的分布式系统基础架构,HADOOP 通常是指一个更广泛的概念——HADOOP 生态圈,主要解决海量数据的存储和海量数据的分析计算问题 2、Hadoop 组成 1)Hadoop HDFS:一个高可靠、高吞吐量的分布式文件系统。2)Hadoop MapReduce:一个分布式的离线并行计算框架。3)Hadoop YARN:作业调度与集群资源管理的框架。4)Hadoop Common:支持其他模块的工具模块(Configuration、RPC、序列化机制、日志操
2020-11-10 14:22:42
240
原创 2020-10-27
今天,怀着无比激动的心情上了第一节我的主课,刚开始对他的懵懂无知 后来经过老师的讲解,我对这门科目有了了解,也了解了大数据的概念是指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合。而他具有4V特征。 容量单位 1 bit(字) 二进制中的一个1 or 一个0 byte(字节) 1byte = 8bit #至少俩字节 一个汉字 2 KB (千字节) 1KB = 1024 byte 2的十次方 3 MB(兆字节) 1MB = 1024 KB 4 GB(吉字节) 1GB = 1024 MB 5
2020-10-27 20:26:07
66
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人