大数据
文章平均质量分 92
分享大数据学习内容
皮皮皮皮皮皮皮卡乒
Java编程爱好者,在CSDN和大家一起进步,互相交流分享学习。
展开
-
大数据技术——HBase安装配置&DDL&DML操作
1. HBase 安装1.1 HBase下载1.2 HBase安装1.3 HBase 初始配置2. 配置高可用并且群起集群2.1 HBase高可用2.2 群起集群2.3 进入HBase客户端3. DDL&DML操作3.1 DDL操作3.2 DML操作原创 2023-01-02 12:03:24 · 920 阅读 · 2 评论 -
Hive——简介&安装&相关部署
1. Hive 基本概念1.1 什么是Hive?1.2Hive 的优缺点1.3 Hive 架构原理1.4 Hive 和数据库比较2. Hive 安装以及部署2.1 Hive 安装地址2.2Hive 安装部署2.2.1 安装 Hive2.2.2 启动并使用 Hive2.3 Hive 元数据配置到 MySQL原创 2022-11-08 22:55:15 · 184 阅读 · 0 评论 -
大数据技术之Zookeeper总结Ⅰ
1. Zookeeper 入门1.1 zookeeper概述1.2 Zookeeper特点1.3 ZooKeeper 数据模型的结构2. Zookeeper 本地安装2.1 本地模式安装2.2 配置参数解读3. Zookeeper 集群操作3.1 集群操作3.2 Zookeeper 集群启动停止脚本3.3 客户端命令行语法原创 2022-11-05 21:51:23 · 557 阅读 · 0 评论 -
Hadoop核心之MapReduce框架总结Ⅲ
4. MapReduce内核源码解析4.1 MapTask工作机制4.2 ReduceTask工作机制4.3 ReduceTask并行度决定机制4.4 MapTask & ReduceTask源码解析5. Join应用5.1 Reduce Join5.2 Map Join6. 数据清洗(ETL)原创 2022-11-04 16:58:58 · 327 阅读 · 0 评论 -
Hadoop核心之MapReduce案例总结
MapReduce程序案例原创 2022-11-03 22:05:32 · 1350 阅读 · 0 评论 -
Hadoop核心之MapReduce框架总结Ⅱ
3. MapReduce框架原理3.1 InputFormat数据输入3.1.1 切片与MapTask并行度决定机制3.1.2 FileInputFormat切片机制3.1.3 CombineTextInputFormat切片机制3.2 MapReduce工作流程3.3 Shuffle机制3.3.1Shuffle机制流程3.3.2Partition分区3.3.3 WritableComparable排序原创 2022-11-03 21:37:20 · 327 阅读 · 0 评论 -
Hadoop核心之MapReduce框架总结Ⅰ
1. MapReduce概述1.1 MapReduce定义1.2 MapReduce优缺点1.3 MapReduce核心思想1.4 MapReduce进程1.5 MapReduce编程规范2.Hadoop序列化2.1 序列化概述2.2 自定义bean对象实现序列化接口(Writable)原创 2022-11-01 21:29:20 · 739 阅读 · 0 评论 -
大数据技术之Hadoop(HDFS知识回顾)
HDFS概述---HDFS产生背景以及定义------HDFS优缺点------HDFS组成架构---HDFS常用shell操作命令---HDFS上传操作命令------HDFS下载操作命令------HDFS直接操作命令---HDFS的API操作HDFS读写流程---HDFS写入数据流程------HDFS读取数据流程---原创 2022-10-24 19:00:44 · 216 阅读 · 0 评论