Hive
撸码小丑
BUG制造商
展开
-
Hive配置Kerberos认证
Hive提供了运行SQL语句查询存储在HDFS上数据的能力,Hive提供的查询引擎,可以将SQL语句转化成MapReduce任务,提交到Hadoop集群上执行。MapReduce任务运行的结果会存在HDFS上。下面的图表示了一个用户运行Hive查询的Hadoop内部交互。 有多种和Hive交互的方法,最常用的是CLI,不过,CLI的设计使其不便于通过编程的方式进行访问。还有可以使用HIveServ转载 2017-11-24 10:30:06 · 3617 阅读 · 0 评论 -
Hive的用户和用户权限
HiverServer2支持远程多客户端的并发和认证,支持通过JDBC、Beeline等连接操作。hive默认的Derby数据库,由于是内嵌的文件数据库,只支持一个用户的操作访问,支持多用户需用mysql保存元数据。现在关心的是HiveServer如何基于mysql元数据库管理用户权限,其安全控制体系与Linux及Hadoop的用户是否存在联系。1)remote方式部署HiveHive中metast转载 2017-11-24 11:19:08 · 4214 阅读 · 0 评论 -
Hive语法详解
先看看Hive的官方介绍:Hive是一个数据仓库基础工具在Hadoop中用来处理结构化数据。它架构在Hadoop之上,总归为大数据,并使得查询和分析方便。并提供简单的sql查询功能,可以将sql语句转换为MapReduce任务进行运行。废话不多说,下面从DDL,DML,DQL三种操作来介绍Hive语法规则。1.DDL 操作1.1建表操作 直接上语法规则CREATE [EXTERNAL] TABLE原创 2017-11-22 14:37:48 · 2837 阅读 · 0 评论 -
Hive安装(使用外部mysql作为元数据库)
一、元数据库mysql的安装#看本机是否安装有mysqlrpm -qa | grep mysql#如果有则先卸载rpm -e mysql;//一般删除,如果提示依赖的其他文件,则不能删除 rpm -e --nodeps mysql;//强力删...原创 2018-02-10 09:31:28 · 967 阅读 · 0 评论 -
Hive优化学习
总结:Hive性能优化上的一些总结 - CSDN博客 https://blog.csdn.net/mrlevo520/article/details/76339075数据分析利器之hive优化十大原则 - 一白侃数 - 博客园 https://www.cnblogs.com/sandbank/p/6408762.html深入浅出数据仓库中SQL性能优化之Hive篇-CSDN.NET ...转载 2018-03-27 14:08:16 · 249 阅读 · 0 评论 -
Hive TopN+分组TopN
TopN可以通过sort by limit N 来实现 比 通过order by limit N 来实现要快得多 个人感觉sort by使用的时候如果能合理使用distribute by的话会更均衡一些 sort by可以启动多个reduce,每个reduce做局部排序,但是这对于sort by limit N已经够用了。 第一个JOB是在每个reduce中做局部排序,然后分别取TOP ...转载 2018-08-17 17:17:09 · 882 阅读 · 0 评论