Hive
红岸水滴
https://github.com/fenglei110
从孤独中寻找自由。
展开
-
Hive的基本概念1
Hive的基本概念1. 什么是HiveHive:由Facebook开源用于解决海量结构化日志的数据统计。Hive是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张表,并提供类SQL查询功能。本质是:将HQL转化成MapReduce程序Hive处理的数据存储在HDFSHive分析数据底层的实现是MapReduce执行程序运行在Yarn上1.2. Hive的优缺点...原创 2019-10-04 10:07:45 · 811 阅读 · 0 评论 -
Hive常用命令2
2.1 数据导入2.1.1 向表中装载数据(Load)语法:hive> load data [local] inpath '/opt/module/datas/order.txt' [overwrite] into table order(partition='20190925');load data:表示加载数据local:表示从本地加载数据到hive表;否则从HDFS加...原创 2019-10-04 11:02:07 · 831 阅读 · 0 评论 -
Hive日常调优3
3.1 Fetch抓取Fetch抓取是指,Hive中对某些情况的查询可以不必使用MapReduce计算。例如:SELECT * FROM orders;在这种情况下,Hive可以简单地读取employee对应的存储目录下的文件,然后输出查询结果到控制台。在hive-default.xml.template文件中hive.fetch.task.conversion默认是more,老版本hive默...原创 2019-10-04 12:16:47 · 1162 阅读 · 0 评论