Hive
编程有了模型
一个专注于用模型树学习法搭建计算机领域基础理论知识体系的专栏。
展开
-
Hive基础知识
目录1.Hive基本概念1.1.Hive简介1.1.1.什么是Hive1.1.2.为什么使用Hive1.1.3.Hive特点1.2.Hive和RDBMS的对比1.3.Hive架构1.4.Hive的数据存储2.Hive环境搭建2.1.Hive安装2.1.1.内嵌derby版本2.1.2.外置MySQL版本2.1.3.Linux RPM方式MySQL...原创 2018-11-22 20:43:06 · 692 阅读 · 0 评论 -
Hive基本操作
目录1.DDL操作1.1.库操作1.1.1.创建库1.1.2.查看库1.1.3.删除库1.1.4.切换库1.2.表操作1.2.1.创建表1.2.2.修改表1.2.3.删除表1.2.4.清空表1.3.其他辅助命令2.DML操作2.1.Load装载数据2.2.Insert插入数据2.3.Insert导出数据2.4.Select查询数据...原创 2018-11-23 10:57:34 · 1108 阅读 · 0 评论 -
Hive高级操作
目录1.Hive数据类型1.1.原子数据类型1.2.复杂数据类型1.3.示例演示1.3.1.array1.3.2.map1.3.3.struct1.3.4.uniontype2.视图3.Hive函数3.1.Hive内置函数3.2.Hive自定义函数UDF3.2.1.一个简单的UDF示例3.2.2.Json数据解析UDF开发3.2.3.Tr...原创 2018-11-23 13:55:37 · 1039 阅读 · 0 评论 -
Hive高级应用
目录1.Hive shell 操作1.1.Hive 命令行1.1.1.进入hive的客户端之后1.1.2.进入hive的客户端之前1.2.Hive 参数配置方式2.数据倾斜2.1.什么是数据倾斜?2.2.Hadoop框架的特定2.3.主要表现2.4.容易数据倾斜的情况2.5.产生数据倾斜的原因2.6.业务场景3.Hive 执行过程实例分析3....原创 2018-11-26 22:48:36 · 1332 阅读 · 0 评论 -
Hive练习题目
----hive 基本操作 1-------------数据自己造 a表:(id int,name string)b表:(id int,job_id int,num int)c表:(job_id int,job string)--建表语句 --加载数据 ---------a表和b表进行链接操作,并观察结果----------------内连接 -- 左连接 lef...原创 2018-12-27 09:56:55 · 2210 阅读 · 0 评论 -
Hive的 DDL和 DML操作总结
目录1、Hive的DDL(data define language)1.1、库的操作1.2、表的操作1.2.1、创建表1.2.2、查看表的描述信息1.2.3、查看表的列表1.2.4、表的修改1.2.5、表/分区 数据的清空1.2.6、删除表1.2.7、查看详细建表语句2、Hive的DML(data managed language)操作2.1、表的数...原创 2018-12-27 15:10:40 · 5654 阅读 · 1 评论 -
Hive-学习日志-20181226
目录1、Hive产生背景及作用2、Hive的数据组织形式3、Hive的视图4、数据存储5、Hive的DDL 和 DML 操作6、Hive的数据类型7、Hive的函数8、内置函数9、自定义函数:Java语言实现10、json解析11、多字节分隔符12、transform的方式???13、Hive的beeline连接14、Hive的Shell...原创 2018-12-27 20:37:59 · 1203 阅读 · 0 评论 -
Hive面试题
注:hive-03中的内容Hive面试题一:现有这么一批数据,现要求出:每个用户截止到每月为止的最大单月访问次数和累计到该月的总访问次数三个字段的意思:用户名,月份,访问次数A,2015-01,5A,2015-01,15B,2015-01,5A,2015-01,8B,2015-01,25A,2015-01,5A,2015-02,4A,2015-02,6B,2...原创 2019-07-22 10:39:16 · 236 阅读 · 0 评论