![](https://img-blog.csdnimg.cn/20201014180756780.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
Hive
文章平均质量分 86
小学僧来啦
这个作者很懒,什么都没留下…
展开
-
HDFS Block块大小限定依据及原则
@Author : Spinach | GHB@Link : http://blog.csdn.net/bocai8058文章目录前言前言原创 2021-08-17 11:18:11 · 8221 阅读 · 0 评论 -
Hive表小文件治理方案
@Date : 2020-04-23@Author : Spinach | GHB@Link : http://blog.csdn.net/bocai8058Hive小文件治理方案方案1方案2方案1方案2原创 2020-04-23 17:10:15 · 1537 阅读 · 2 评论 -
Flume、Kafka、Hbase、Hive适用场景
@Author : Spinach | GHB@Link : http://blog.csdn.net/bocai8058文章目录Flume、Kafka适用场景Hbase适用场景Hive适用场景Flume、Kafka适用场景Kafka、Flume都可以实现数据的传输,但它们的侧重点不同。Kafka追求的是高吞吐量、高负载(topic下可以有多个partition)Flu...原创 2018-10-06 22:10:11 · 1640 阅读 · 0 评论 -
不同Hive SQL下转换成MapReduce的情况
@Author : Spinach | GHB@Link : http://blog.csdn.net/bocai8058[TOC]Hive概念Hive是基于Hadoop的一个数据仓库系统,在各大公司都有广泛的应用。美团数据仓库也是基于Hive搭建,每天执行近万次的Hive ETL计算流程,负责每天数百GB的数据存储和分析。Hive的稳定性和性能对我们的数据分析非常关键。Ma...原创 2018-10-07 10:58:54 · 2387 阅读 · 0 评论 -
Hbase与Hive数据同步
@Author : Spinach | GHB@Link : http://blog.csdn.net/bocai8058文章目录同步过程同步过程在Hbase中创建一张表create ‘user_sysc’, {NAME => ‘info’};在hive中运行如下,从而创建一个外部表user_sysc:# 在hive中创建一个外表CREATE EXTERNAL ...原创 2018-10-07 11:03:20 · 3595 阅读 · 0 评论 -
Spark的join实现的3种方式(与Hive中的join对比)
@Author : Spinach | GHB@Link : http://blog.csdn.net/bocai8058文章目录1 Spark的join与Hive的join对比1.1 数据准备1.2 Hive的join、left outer join、right outer join1.3 Spark的join、leftOuterJoin、rightOuterJoin2 Spar...转载 2018-10-14 21:54:51 · 2330 阅读 · 0 评论 -
Drop_Delete_Truncate区别(Hive SQL与MySQL对比)
@Author : Spinach | GHB@Link : http://blog.csdn.net/bocai8058文章目录不同方面对比deletedroptruncat适用场景Hive中的操作(drop、truncat)不同方面对比DML:data maintain LanguageDLL:data define language操作操作类型功能表...原创 2018-10-07 11:04:53 · 2042 阅读 · 0 评论