- 博客(2)
- 收藏
- 关注
原创 2020-11-17
HDFSHDFS是一个高度容错性的系统,适合部署在廉价的机器上。HDFS能提供高吞吐量的数据访问,非常适合大规模数据集上的应用。一、HDFS体系结构1、低成本:兼容廉价的硬件设备。2、处理大规模数据:典型文件大小GB-TB级别;关注横向扩展。3、批量数据访问:批量读而非随机读;关注吞吐量而非响应时间。4、告容错:副本冗余机制。(指重复配置系统的一些部分)5、适应场景:大文件访问;静态数据(状态没做改变时候的数据)访问。6、不适应场景:存储大量小文件;随机读取,低延迟读取。二、HDFS体系结
2020-11-17 19:49:52 51
原创 2020-11-11
大数据生态系统• Hadoop主要解决海量数据储存和海量数据的分析计算。它具有好可靠性、高扩展性、高效性和高容错性。Hadoop有三个组件:HDFS、MapReduce和HBase。一、HDFS是一个高度容错性的系统,适合部署在廉价的机器上。HDFS能提供高吞吐量的数据访问,非常适合大规模数据集上的应用。二、Apache Hadoop YARN (Yet Another Resource Negotiator,另一种资源协调者)是一种新的 Hadoop 资源管理器,它是一个通用资源管理系统,可为上
2020-11-11 15:57:52 193
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人