Hive_泰山不老生的博客-CSDN博客

Hive

关注

文章平均质量分 82

关注数：文章数：5 文章阅读量：47400 文章收藏量：37

作者: 泰山不老生

耿嘉安，15年IT经验。《深入理解Spark》与《Spark内核设计的艺术》两书的作者。Apache Spark Contributor和MongoDB Contributor。曾就职于阿里巴巴，基于ODPS构建大数据商业解决方案——御膳房。曾负责艺龙大数据平台的架构工作。现在负责360对于Spark的运维、调优、扩展、开发等工作。在大量的工作实践中，对J2EE、JVM、Tomcat、Spring、Hadoop、Spark、MySQL、Redis、Zookeeper都有深入研究。早期从事J2EE企业级应用开发，对Java相关技术有独到见解。业余喜欢研究中国古代历史，古诗词，旅游，足球等。

展开

Hive通过查询语句向表中插入数据过程中发现的坑

在学习使用Hive的过程中，发现了一些坑，它们或许是Hive提倡的比关系数据库更加自由的体现（同时引来一些问题），或许是一些bug。总而言之，这些都需要使用Hive的开发人员额外注意。本文旨在列举我发现的2个通过查询语句向表中插入数据过程中的问题，希望大家注意。

原创 2016-07-21 09:47:54 · 34415 阅读 · 8 评论
Spark1.6.0——HiveThriftServer2的生命周期管理

前言几年前，我在刚刚进入大数据领域的时候，很快就了解到Hive所提供的一种另类的SQL。最初使用Hive的命令行提交任务，后来便用上了HiveServer和HiveServer2。半年前第一次注意到Spark的Thrift服务，当时心中就笃定它肯定与HiveServer2有着某种联系，直到在工作中真正使用它。在使用HiveThriftServer2的过程中，通过故障排查、源码分析和功能优化...

原创 2018-03-09 11:43:03 · 4040 阅读 · 0 评论
Spark1.6.0功能扩展——为HiveThriftServer2增加HA

前言 HiveThriftServer2是Spark基于HiveServer2实现的多Session管理的Thrift服务，提供对Hive的集中式管理服务。HiveThriftServer2作为Yarn上的Application，目前只支持yarn-client模式——即Driver运行在本地，ApplicationMaster运行在NodeManager所管理的Container中。yarn-c...

原创 2018-04-16 10:10:36 · 2851 阅读 · 0 评论
Spark2.1.0之剖析spark-shell

通过在spark-shell中执行word count的过程，让读者了解到可以使用spark-shell提交Spark作业。现在读者应该很想知道spark-shell究竟做了什么呢？脚本分析在Spark安装目录的bin文件夹下可以找到spark-shell，其中有代码清单1-1所示的一段脚本。代码清单1-1 spark-shell脚本function m...

原创 2018-04-20 09:30:10 · 4317 阅读 · 0 评论
Spark2.1.0之模块设计

在阅读本文之前，读者最好已经阅读了《Spark2.1.0之初识Spark》和《Spark2.1.0之基础知识》两篇文章。本文将主要介绍Spark2.1.0版本中的模块设计以及各个模块的功能和特点。整个Spark主要由以下模块组成：Spark Core：Spark的核心功能实现，包括：基础设施、SparkContext（Application通过SparkContext提交）、Spark执行环境（S...

原创 2018-06-05 10:00:02 · 1782 阅读 · 2 评论

Hive

作者: 泰山不老生

Hive通过查询语句向表中插入数据过程中发现的坑

Spark1.6.0——HiveThriftServer2的生命周期管理

Spark1.6.0功能扩展——为HiveThriftServer2增加HA

Spark2.1.0之剖析spark-shell

Spark2.1.0之模块设计