Hadoop
越努力越幸运再努力
这个作者很懒,什么都没留下…
展开
-
Hadoop 系列(一)基本概念
一、Hadoop 简介 Hadoop 是一个由 Apache 基金会所开发的分布式系统基础架构,它可以使用户在不了解分布式底层细节的情況下开发分布式程序,充分利用集群的威力进行高速运算和存储。 从其定义就可以发现,它解決了两大问题:大数据存储、大数据分析。也就是 Hadoop 的两大核心:HDFS 和 MapReduce。 HDFS(Hadoop Distributed File Sys...原创 2019-05-29 09:03:19 · 326 阅读 · 0 评论 -
Hadoop 系列(二)安装配置
一、Hadoop 安装 1.1 Hadoop 依赖的组件 JDK :从 Oracle 官网下载,设置环境变量(JAVA_HOME、PATH 和 CLASSPATH)。 SSH(安全外壳标议) :推荐安装 Openssh。 Hadoop 需要通过 SSH 来启动 Slave 列表中各台主机的守护进程,因此 SSH 也是必须安装的,即使是安装伪分布式版本(因为 Hadoop ...原创 2019-05-29 11:50:39 · 1104 阅读 · 0 评论 -
大数据学习路线指南(最全知识点总结)
大数据学习路线指南(最全知识点总结) 大数据是对海量数据进行存储、计算、统计、分析处理的一系列处理手段,处理的数据量通常是TB级,甚至是PB或EB级的数据,这是传统数据处理手段所无法完成的,其涉及的技术有分布式计算、高并发处理、高可用处理、集群、实时性计算等,汇集了当前IT领域热门流行的IT技术。 大数据是对海量数据进行存储、计算、统计、分析处理的一系列处理手段,处理的数据量通常是TB级,甚至...原创 2019-05-30 08:23:40 · 213 阅读 · 0 评论