不清不慎的博客

java大数据开发工程师、数据挖掘、人工智能、区块链兴趣爱好者。 Github地址:https://github.com/ljcan...

Hive调优总结

熟悉Hive的开发者都知道,Hive会将操作语句转换为MapReduce作业,对于开发者是透明的,我们并不需要理解其原理就可以专注手头的工作,但是在实际开发当中数据量巨大,我们需要采取一些优化措施来提高MR作业的效率。 1.执行计划 与关系型数据库一样,我们可以使用EXPLAIN命令来分析HQL...

2019-05-05 18:40:59

阅读数 141

评论数 1

Hive文件存储格式查询性能的比较

一、Hive的文件存储格式 Hive总共支持以下几种文件存储格式: Text File SequenceFile RCFile Avro Files ORC Files Parquet Custom INPUTFORMAT and OUTPUTFORMAT 这里,我们主要比较Text Fi...

2018-04-09 21:50:37

阅读数 840

评论数 0

Hive安装部署以及初步使用

一、Hive概述 HIve是什么?为什么要使用hive?对于一个初步接触hive的初学者,这些都是迷惑的,因此本文主要带你入门hive,让你了解到hive的安装使用以及在hive在大数据中的位置。 1.为什么要使用hive? 在了解hive之前,相信大家都使用过mapreduce以及hd...

2018-04-03 21:44:11

阅读数 479

评论数 0

提示
确定要删除当前文章?
取消 删除