Hadoop大数据处理
文章平均质量分 95
黄晴风
大世界花花绿绿,看花了我的花衬衫
展开
-
Hadoop大数据-HDFS的Shell操作
上一节,讲解了HDFS的原理,以及相关的hadoop系统安装文档,参考文档可以轻松的搭建好,Hadoop伪分布式集群环境,这一节主要讲解一下如何操作HDFS,及HDFS文件的存储方式。本章对HDFS的常见操作方法做了简单介绍,掌握需要结合实际操作过程,实验操作手册请在下载专区下载。原创 2024-03-25 15:19:31 · 1090 阅读 · 2 评论 -
Hadoop大数据-HDFS分布式文件系统
Hadoop分布式文件系统(HDFS)扮演着非常重要的大数据存储作用,以文件的形式为上层应用提供海量的数据存储服务,高可靠、高容错、高扩展性。本文具体介绍HDFS分布式文件系统,实验安装部分可参考Hadoop伪分布式集群环境搭建可参考博客资源下载Hadoop集群部署及测试实验(一).docxHadoop集群部署及测试实验(二).docxHadoop集群部署及测试实验(三).docx。原创 2024-03-05 18:40:37 · 1258 阅读 · 1 评论 -
初识Hadoop-大数据概述
根据IDC 监测,人类产生的数据量正在呈指数级增长,大约每两年翻一番,这个速度会继续保持下去,数据结构日趋复杂,大量新数据源的出现则导致非结构化、半结构化数据爆发式的增长。2020 年,整个世界的数据总量达到60ZB(1ZB=10 亿TB)中国数据量增速迅猛,总量占全球占比达20%大数据(big data),指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力来适应海量、高增长率和多样化的信息资产。原创 2024-03-01 19:38:27 · 775 阅读 · 0 评论