Hadoop生态圈技术
文章平均质量分 81
悠然予夏
(考研备战中)纵有疾风起,人生不言弃;风乍起,合当奋意向此生;熬过无人问津的日子,才有诗和远方。
喜欢Java,热爱编程。
展开
-
Azkaban使用
介绍了如何使用Azkaban进行任务作业原创 2022-11-01 20:47:04 · 1028 阅读 · 0 评论 -
Azkaban集群模式部署
介绍了Azkaban的集群方式的搭建原创 2022-11-01 19:38:04 · 820 阅读 · 0 评论 -
Azkaban安装部署
介绍了Azkaban的单节点安装部署原创 2022-11-01 19:09:26 · 994 阅读 · 0 评论 -
工作流调度系统Azkaban
简要的的介绍了任务调度框架Azkaban,分析了其优缺点原创 2022-11-01 17:30:21 · 874 阅读 · 0 评论 -
布隆过滤器在hbase的应用
介绍了如何在HBase实现布隆过滤器的思路以及好处原创 2022-10-31 10:31:41 · 503 阅读 · 0 评论 -
HBase表的RowKey设计、热点和二级索引
对HBase表的RowKey设计、热点和二级索引进行了简要的说明原创 2022-10-31 10:26:17 · 1114 阅读 · 0 评论 -
Hbase 协处理器
介绍了Hbase 协处理器,并使用代码进行了演示原创 2022-10-31 10:02:35 · 721 阅读 · 0 评论 -
HBase API客户端操作
介绍了如何使用Java代码的方式来操作HBase数据库原创 2022-10-31 09:47:18 · 260 阅读 · 0 评论 -
HBase表的预分区(region) 与 Region 合并
介绍了HBase表的预分区和Region合并原创 2022-10-30 10:59:54 · 828 阅读 · 0 评论 -
Region 拆分机制
介绍了HBase的Region拆分机制原创 2022-10-30 10:47:30 · 601 阅读 · 0 评论 -
HBase的flush(刷写)及compact(合并)机制
简要的介绍了HBase的刷写与合并机制原创 2022-10-29 23:01:38 · 1590 阅读 · 0 评论 -
HBase读数据流程与写数据流程
简要的介绍了HBase读取数据与写入数据的过程原创 2022-10-29 21:07:42 · 1096 阅读 · 0 评论 -
HBase shell 基本操作
介绍了HBase的使用方式,并使用案例进行了演示原创 2022-10-29 20:28:50 · 1071 阅读 · 0 评论 -
HBase集群安装部署
介绍了HBase的安装方法原创 2022-10-29 17:47:11 · 368 阅读 · 0 评论 -
HBase概述
简要的介绍了HBase的基本概念原创 2022-10-29 12:47:01 · 2232 阅读 · 0 评论 -
hadoop高可用集群配置
介绍了如何搭建高可用hadoop HA集群原创 2022-10-28 22:24:02 · 1667 阅读 · 0 评论 -
Hadoop HA介绍
对Hadoop高可用进行了简要的介绍原创 2022-10-28 19:00:22 · 1027 阅读 · 0 评论 -
Impala进阶
介绍了Impala的负载均衡和一些优化细节原创 2022-10-27 10:04:42 · 699 阅读 · 0 评论 -
Impala的JDBC方式查询
介绍了Impala如何使用Java代码方式进行数据查询原创 2022-10-27 09:38:05 · 1205 阅读 · 0 评论 -
Impala的使用
介绍了Impala如何使用sql语句原创 2022-10-26 23:04:20 · 2578 阅读 · 0 评论 -
Imapla的架构原理
简要的介绍了Impala的原理原创 2022-10-26 22:07:07 · 816 阅读 · 0 评论 -
Impala入门案例
使用案例演示了Impala的使用方法原创 2022-10-26 08:35:59 · 767 阅读 · 0 评论 -
Impala 安装
介绍了如何进行Impala的安装原创 2022-10-25 19:39:39 · 3929 阅读 · 2 评论 -
Impala概述
介绍了Impala的基本概念原创 2022-10-24 20:55:52 · 1592 阅读 · 0 评论 -
Sqoop常用命令及参数
介绍了sqoop常用配置属性原创 2022-10-23 23:03:39 · 345 阅读 · 0 评论 -
Sqoop应用案例
使用案例演示了sqoop的操作方式原创 2022-10-23 22:06:22 · 464 阅读 · 0 评论 -
数据迁移工具 -- Sqoop 安装配置
介绍了sqoop的概念以及如何进行安装原创 2022-10-23 21:29:42 · 600 阅读 · 0 评论 -
Flume高级特性
介绍了Flume的其他高级特性原创 2022-10-23 15:42:55 · 348 阅读 · 0 评论 -
Flume基础应用
介绍了flume的基本使用原创 2022-10-23 11:05:31 · 1239 阅读 · 0 评论 -
Flume安装部署
介绍了Flume安装部署原创 2022-10-22 15:52:38 · 308 阅读 · 0 评论 -
数据采集工具 -- Flume
介绍了数据采集工具 -- Flume的基本概念与功能原创 2022-10-22 15:11:04 · 2283 阅读 · 0 评论 -
数据交互工具 -- HUE
介绍了hive的可视化界面hue的搭建方式原创 2022-10-22 12:41:04 · 1451 阅读 · 0 评论 -
Hive案例
使用一个案例,演示了如何使用sql语句进行数据操作原创 2022-10-20 12:47:11 · 869 阅读 · 0 评论 -
hive优化实战
使用案例演示了hive如何对数据进行优化原创 2022-10-19 21:20:14 · 423 阅读 · 0 评论 -
Hive调优策略之SQL优化
介绍了hive如何从sql层面进行调优原创 2022-10-17 20:01:05 · 2739 阅读 · 0 评论 -
Hive调优策略之参数优化
介绍了Hive如何进行通过参数进行调优原创 2022-10-16 20:50:42 · 892 阅读 · 0 评论 -
Hive调优策略之架构优化
Hive作为大数据领域常用的数据仓库组件,在设计和开发阶段需要注意效率。影响Hive效率的不仅仅是数据量过大;数据倾斜、数据冗余、job或I/O过多、MapReduce分配不合理等因素都对Hive的效率有影响。对Hive的调优既包含对HiveQL语句本身的优化,也包含Hive配置项和MR方面的调整。原创 2022-10-16 20:31:33 · 419 阅读 · 0 评论 -
Hive数据存储格式
Hive支持的存储数的格式主要有:TEXTFILE(默认格式) 、SEQUENCEFILE、RCFILE、ORCFILE、PARQUET。原创 2022-10-16 16:28:31 · 3802 阅读 · 0 评论 -
Hive元数据管理
介绍了hive的Metastore、HiveServer2、HCatalog三个启动器原创 2022-10-16 13:53:22 · 1777 阅读 · 0 评论 -
HQL操作之--DML命令
介绍了hive的数据操作,并进行了演示说明原创 2022-10-15 15:57:12 · 434 阅读 · 0 评论