hadoop
文章平均质量分 67
Hadoop从入门到实战
Galen-gao
Full-stack java, scala developer, code geek, programming geek
展开
-
创建并配置一个伪分布式Hadoop3.x版本集群(三)
为了保证应用高可用性,一般我们都会搭建一个应用的集群环境,这样即使其中一个应用出现故障,集群中的其他应用仍可继续对外提供访问。本章将介绍如何安装和配置一个伪分布式集群。hadoop环境准备搭建一个简单的伪分布式Hadoop集群操作hadoop集群使用hadoop运行测试程序本文中我们使用一台机器完成了Hadoop的伪分布式集群部署,在实际的生成活动中,此种模式只能用于开发人员进行测试使用,下一章将介绍如何搭建一个Hadoop的完全分布式集群,敬请期待。原创 2022-10-02 09:15:00 · 1416 阅读 · 0 评论 -
Hadoop从入门到精通实战系列文章
Hadoop是Apache旗下的一个用java语言实现开源软件框架,是一个开发和运行处理大规模数据的软件平台。允许使用简单的编程模型在大量计算机集群上对大型数据集进行分布式处理。欢迎来到Hadoop大数据时代,Hadoop在处理海量数据有着非常大的优势,现在正是成为一个大数据开发工程师的好时机,下面让我们一步步迈进大数据世界里,未来我会学习并更新大数据相关的文章博客。第1章:初始Hadoop。原创 2022-09-27 17:38:42 · 675 阅读 · 0 评论 -
初始Hadoop(一)
海量数据处理Hadoop是专门为处理海量大数据应用而生的,其处理的数据容量能高达PB甚至EB级。可靠性Hadoop从设计初就充分考虑到当计算机出现硬件故障,依然能够高效存储和分析数据并且数据不会出现丢失的问题,这一切并且得益于Hadoop良好的架构设计。流式处理传统数据库用于快速访问数据,而不是批处理。Hadoop一开始就考虑到批处理的场景,例如使用Hadoop为上百万个网页建立索引。数据一致性与传统数据库不同,Hadoop数据文件适用于一次写多次读的业务场景。弹性收缩。原创 2022-09-27 12:30:48 · 898 阅读 · 1 评论