- 博客(4)
- 收藏
- 关注
原创 hive
尚硅谷大数据技术之Hive(作者:尚硅谷大数据研发部)版本:V1.5第1章 Hive基本概念1.1 什么是HiveHive:由Facebook开源用于解决海量结构化日志的数据统计。Hive是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张表,并提供类SQL查询功能。本质是:将HQL转化成MapReduce程序图1-1 HQL转换MR流程1)Hive处理的数据存...
2020-03-08 21:12:39 594
原创 HAHADOOP
尚硅谷大数据技术之Hadoop(HDFS)(作者:尚硅谷大数据研发部)版本:V2.0第1章 HDFS概述1.1 HDFS产出背景及定义1.2 HDFS优缺点1.3 HDFS组成架构1.4 HDFS文件块大小(面试重点)第2章 HDFS的Shell操作(开发重点)1.基本语法bin/hadoop fs 具体命令 OR bin/hdfs dfs 具体命令dfs是fs的实现类...
2020-03-08 21:09:53 142
原创 zookeeper
尚硅谷大数据技术之Zookeeper(作者:尚硅谷大数据研发部)版本:V2.0第1章 Zookeeper入门1.1 概述Zookeeper是一个开源的分布式的,为分布式应用提供协调服务的Apache项目。1.2 特点1.3 数据结构1.4 应用场景提供的服务包括:统一命名服务、统一配置管理、统一集群管理、服务器节点动态上下线、软负载均衡等。1.5 下载地址1.官网首页:ht...
2020-03-08 21:09:00 177
原创 hadoop
尚硅谷大数据技术之Hadoop(入门)(作者:尚硅谷大数据研发部)版本:V2.0第1章 大数据概论1.1 大数据概念大数据概念如图2-1所示。图2-1 大数据概念1.2 大数据特点(4V)大数据特点如图2-2,2-3,2-4,2-5所示图2-2 大数据特点之大量图2-3 大数据特点之高速图2-4 大数据特点之多样图2-5 大数据特点之低价值密度1.3 大数据应用场景大数...
2020-03-08 21:07:24 1040
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人