自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(4)
  • 收藏
  • 关注

原创 hive复制表

Hive中如何快速的复制一张分区表(包括数据)关键字:Hive 复制表Hive中有时候会遇到复制表的需求,复制表指的是复制表结构和数据。如果是针对非分区表,那很简单,可以使用CREATE TABLE new_table AS SELECT * FROM old_table;那么如果是分区表呢?首先想到的办法可能是:先创建一张和old_table结构相同的new_table,包括分区;可以使用CREATE TABLE new_table LIKE old_table;接下来使用动态分区,把old

2021-01-14 09:23:04 1767

原创 hive动态分区遇见的问题记录

项目场景:将hbase数据卸出到hive分区表:项目场景:按省份分区(36个分区),数据量50亿,数据大小4T左右使用动态分区时首先不要忘记的一些配置:是否开启动态分区 hive.exec.dynamic.partition动态分区是否使用严格模式 hive.exec.dynamic.partition.modeMR总共可创建最大分区数 hive.exec.max.dynamic.partition.partitions (默认1000)以及当前节点可创建的最大分区数 hive.exec.ma

2020-10-27 10:37:30 689

原创 [Hive优化]--实际生产中常用参数优化汇总

提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档HIve优化使用动态分区需要加配置:使用自动优化:(mapjoin)使用负载均衡:设置map和reduce的任务处理的字节数直接设置map和reduce任务数设置最大reduce数限制修改字段类型(注意跟presto集成会有问题)设置运行内存,应对运行时报错:java 堆内存溢出使用动态分区需要加配置:SET hive.exec.dynamic.partition=true;SET hive.exec.dynamic.partitio

2020-10-26 10:22:02 386 1

原创 HIve动态分区实际操作

Hive 根据表中某个字段动态分区1.what这个技术是什么官方文档定义Apache Spark™ is a unified analytics engine for large-scale data processing. 就是大数据分析引擎,至于unified(统一),应该是因为下图。Combine SQL, streaming, and complex analytics.Spark powers a stack of libraries including SQL and DataFram

2020-10-19 13:41:35 270

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除