hive
lemon lime
放弃很简单,但坚持一定很酷!
展开
-
Hive简介(上)
Hive简介(上) 一,Hive及数据仓库简介 Hive是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张hive数据库表,并提供了简单的sql查询功能,可以将sql语句转换为MapReduce任务执行。 Hive的出现使Java编程者可以对HDFS数据做mapreduce操作(无需清楚文件的存储和任务的运行)。使用SQL来快速实现简单的Mapreduce统计,不必开发...原创 2019-01-12 22:16:47 · 349 阅读 · 0 评论 -
Hive(下)
Hive(下) 一,Hive分区与自定义函数 1.1 Hive的分区 partition 假如现在我们公司一天产生3亿的数据量,那么为了方便管理和查询,此时可以建立分区(可按日期 部门等具体业务分区)。分门别类的管理 注意:必须在表创建的时候创建 partition!!! 分区分为:单分区和多分区 分区分为:静态分区和动态分区 1.1.1 创建分区 单分区建表语句: create table d...原创 2019-01-14 19:22:04 · 460 阅读 · 0 评论