hive
自由地带
踏踏实实的程序员
展开
-
hive总结01_简述与安装
目录Hive简述架构与传统数据库比较安装地址安装部署常见属性配置MySql安装Hive元数据配置到MySqlHiveJDBC访问常用交互命令其他命令操作Hive简述Hive:由Facebook开源用于解决海量结构化日志的数据统计。Hive是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张表,并提供类SQL查询功能。特点...转载 2019-07-30 00:09:15 · 123 阅读 · 0 评论 -
hive总结03_内部表、外部表和分区表
目录创建表管理表外部表管理表与外部表的互相转换分区表分区表基本操作分区表注意事项修改表重命名表增加、修改和删除表分区增加/修改/替换列信息删除表创建表1.建表语法 CREATE [EXTERNAL] TABLE [IF NOT EXISTS] table_name [(col_name data_type [COMMEN...翻译 2019-08-03 00:46:05 · 245 阅读 · 0 评论 -
hive总结04_查询以及分通抽样
目录查询基本查询(Select…From)全表和特定列查询列别名算术运算符常用函数Limit语句Where语句比较运算符(Between/In/ Is Null)Like和RLike逻辑运算符(And/Or/Not)分组Group By语句Having语句Join语句等值Join表的别名内联接左外连接右外连接满外...翻译 2019-08-03 18:26:20 · 429 阅读 · 0 评论 -
hive总结05_函数和压缩
目录函数系统内置函数自定义函数自定义UDF函数压缩和存储Hadoop源码编译支持Snappy压缩资源准备编译源码Hadoop压缩配置MR支持的压缩编码压缩参数配置开启Map输出阶段压缩开启Reduce输出阶段压缩文件存储格式列式存储和行式存储TextFile格式Orc格式Parquet格式存储和压缩结合修改Hadoo...翻译 2019-08-03 22:34:45 · 241 阅读 · 0 评论 -
hive总结06_企业级调优
目录本地模式表的优化小表、大表Join大表Join大表MapJoinGroup ByCount(Distinct) 去重统计笛卡尔积行列过滤动态分区调整分桶分区数据倾斜合理设置Map数小文件进行合并复杂文件增加Map数合理设置Reduce数并行执行严格模式JVM重用推测执行压缩执行计划(Explain)...翻译 2019-08-03 23:37:21 · 118 阅读 · 0 评论 -
hive总结02_数据类型以及操作数据库
目录数据类型基本数据类型集合数据类型类型转化DDL数据定义创建数据库查询数据库显示数据库查看数据库详情切换当前数据库修改数据库删除数据库数据类型基本数据类型 Hive数据类型 Java数据类型 长度 例子 TINYINT by...翻译 2019-08-03 00:48:32 · 152 阅读 · 0 评论