Hive
文章平均质量分 56
YQlakers
这个作者很懒,什么都没留下…
展开
-
Hive元数据库表分析和操作
在安装Hive时,需要在hive-site.xml文件中配置元数据相关信息。与传统关系型数据库不同的是,hive表中的数据都是保存的HDFS上,也就是说hive中的数据库、表、分区等都可以在HDFS找到对应的文件。这里说到的元数据可以理解成hive中用于保存数据库、表、分区或者表字段等基本属性,以及这些属性与HDFS文件对应关系的一个映射。 这些映射关系比较常见的一个场景是保存在mysq转载 2017-05-16 17:04:03 · 911 阅读 · 0 评论 -
Hive与传统数据库的区别
Hive在很多方面和传统数据库类似(例如支持SQL接口),但是其底层对HDFS金额MapReduce的依赖意味着它的体系结构有 别于传统数据库,而这些区别又影响着Hive所支持的特性,进而影响着Hive的使用。读时模式VS写时模式在传统数据库里,表的模式是在数据加载时强制确定的。如果在加载时发现数据不符合模式,则被拒绝加载数据。因为数据是在写入数据库是对照模式进行检查,因此这一设计有时被称原创 2017-05-16 18:38:06 · 4886 阅读 · 1 评论 -
Hive的托管表和外部表
在Hive中创建表时,默认情况下Hive负责管理数据。这意味着Hive把数据移入到它的“仓库目录”。另外一种选择是创建一个“外部表”(external table)。这会让Hive到仓库目录以外的位置去访问数据。这两种表的区别表现在LOAD和DROP命令的语义上。先来看托管表(managed table)。加载数据到托管表时,Hive把数据移到仓库目录。例如:CREATE TA原创 2017-06-09 19:01:08 · 3369 阅读 · 0 评论