Hadoop
文章平均质量分 92
大数据Hadoop技术
帝乙岩
尽人事以听天命;世界因改变而精彩
展开
-
Hive第二篇HQL
hivesql原创 2024-04-22 16:10:22 · 847 阅读 · 0 评论 -
Hive第一篇简介
1. 数据仓库1.1. 基本概念1.2. 主要特征1.2.1. 面向主题1.2.2. 集成性1.2.3. 非易失性1.2.4. 时变性1.3. 数据库与数据仓库的区别1.4. 数仓的分层架构为什么要对数据仓库分层?1.5. 数仓的元数据管理2. Hive 的基本概念2.1. Hive 简介什么是 Hive为什么使用 Hive2.2. Hive 架构2.3. Hive 与 Hadoop 的关系2.4. Hive与传统数据库对比2.5. Hive 的安装第一步:上传并解压安装包第二步:安装mysql。原创 2024-04-22 16:08:02 · 1159 阅读 · 0 评论 -
Yarn资源调度
yarn是hadoop集群当中的资源管理系统模块,从hadoop2.0开始引入yarn模块,yarn可为各类计算框架提供资源的管理和调度,主要用于管理集群当中的资源(主要是服务器的各种硬件资源,包括CPU,内存,磁盘,网络IO等)以及调度运行在yarn上面的各种任务。yarn核心出发点是为了分离资源管理与作业监控,实现分离的做法是拥有一个全局的资源管理(ResourceManager,RM),以及每个应用程序对应一个的应用管理器(ApplicationMaster,AM)原创 2024-04-22 09:51:26 · 635 阅读 · 0 评论 -
MapReduce第二篇shuffle
shuffle操作包含:分区,排序,规约,分组原创 2024-04-21 18:17:31 · 785 阅读 · 0 评论 -
MapReduce第一篇简介
基础内容原创 2024-04-21 16:34:02 · 901 阅读 · 0 评论 -
HDFS第一篇简介
hdfs简介原创 2024-04-20 16:58:22 · 595 阅读 · 0 评论 -
HDFS第二篇hdfs_shell命令
hdfs_shell命令原创 2024-04-20 17:06:43 · 623 阅读 · 0 评论 -
Hadoop简介
hadoop简介原创 2024-04-09 16:00:14 · 2431 阅读 · 0 评论