Hive
jiangxuchen
这个作者很懒,什么都没留下…
展开
-
(1)初始Hive —— 深入浅出学Hive
转自:http://sishuok.com/forum/blogPost/list/6220.html第一部分:Hive简介什么是Hive•Hive是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张数据库表,并提供类SQL查询功能。•本质是将SQL转换为MapReduce程序 第二部分:为什么使用Hive转载 2014-01-16 17:05:13 · 1049 阅读 · 0 评论 -
(10)Hive体系结构 —— 深入浅出学Hive
转自:http://sishuok.com/forum/blogPost/list/6220.html第一部分:概念 概念•用户接口:用户访问Hive的入口•元数据:Hive的用户信息与表的MetaData•解释器:分析翻译HQL的组件•编译器:编译HQL的组件•优化器:优化HQL的组件第二部分:Hive架构与转载 2014-01-16 17:19:29 · 1047 阅读 · 0 评论 -
(8)Hive Shell 基本操作——深入浅出学Hive
转自:http://sishuok.com/forum/blogPost/list/6220.html第一部分:Hive bin下脚本介绍Hive bin下的脚本介绍Exthivehive-config第二部分:Hive Shell 基本操作Hive 命令行•hive [-hivec转载 2014-01-16 17:16:39 · 6679 阅读 · 0 评论 -
(7)Hive QL——深入浅出学Hive
转自:http://sishuok.com/forum/blogPost/list/6220.html第一部分:DDLDDL•建表•删除表•修改表结构•创建/删除视图•创建数据库•显示命令建表CREATE [EXTERNAL] TABLE [IF NOT EXISTS] table_name [(col_name data_type [COMMENT col_comme转载 2014-01-16 17:15:13 · 1194 阅读 · 0 评论 -
(6)Hive 高级编程——深入浅出学Hive
转自:http://sishuok.com/forum/blogPost/list/6220.html第一部分:产生背景产生背景•为了满足客户个性化的需求,Hive被设计成一个很开放的系统,很多内容都支持用户定制,包括:•文件格式:Text File,Sequence File•内存中的数据格式: Java Integer/String, Hadoop IntWritable/Tex转载 2014-01-16 17:12:28 · 3503 阅读 · 0 评论 -
(5)hive参数——深入浅出学Hive
转自:http://sishuok.com/forum/blogPost/list/6220.html第一部分:Hive 参数hive.exec.max.created.files•说明:所有hive运行的map与reduce任务可以产生的文件的和•默认值:100000 hive.exec.dynamic.partit转载 2014-01-16 17:11:15 · 876 阅读 · 0 评论 -
(3)Hive 内建操作符与函数开发——深入浅出学Hive
转自:http://sishuok.com/forum/blogPost/list/6220.html第一部分:关系运算Hive支持的关系运算符•常见的关系运算符•等值比较: =•不等值比较: •小于比较: •小于等于比较: •大于比较: >•大于等于比较: >=•空值判断: IS NULL•非转载 2014-01-16 17:07:14 · 1128 阅读 · 0 评论 -
(4)Hive JDBC——深入浅出学Hive
转自:http://sishuok.com/forum/blogPost/list/6220.html第一部分:搭建Hive JDBC开发环境搭建:Steps•新建工程hiveTest•导入Hive依赖的包•Hive 命令行启动Thrift服务•hive --service hiveserver &转载 2014-01-16 17:09:24 · 1075 阅读 · 0 评论 -
(2)Hive安装与配置——深入浅出学Hive
转自:http://sishuok.com/forum/blogPost/list/6220.html第一部分:软件准备与环境规划Hadoop环境介绍•Hadoop安装路径•/home/test/Desktop/hadoop-1.0.0/•Hadoop 元数据存放目录•/home/test/data/core/namenode•H转载 2014-01-16 17:05:19 · 5341 阅读 · 0 评论 -
(9)hive 优化——深入浅出学Hive
转自:http://sishuok.com/forum/blogPost/list/6220.html第一部分:Hadoop 计算框架的特性什么是数据倾斜•由于数据的不均衡原因,导致数据分布不均匀,造成数据大量的集中到一点,造成数据热点Hadoop框架的特性•不怕数据大,怕数据倾斜•jobs数比较多的作业运行效率相对比较低,比如即使有几百行的表,如果多次关联多次汇总,产生十几个j转载 2014-01-16 17:17:26 · 954 阅读 · 0 评论 -
(11)Hive的原理—— 深入浅出学Hive
转自:http://sishuok.com/forum/blogPost/list/6220.html第一部分:Hive原理为什么要学习Hive的原理•一条Hive HQL将转换为多少道MR作业•怎么样加快Hive的执行速度•编写Hive HQL的时候我们可以做什么•Hive 怎么将HQL转换为MR作业•Hive会采用什么样的转载 2014-01-16 17:21:43 · 1385 阅读 · 0 评论