hive
文章平均质量分 80
cm_chenmin
这个作者很懒,什么都没留下…
展开
-
hive建库建表与数据导入导出
hive建表:hive分内部表与外部表,创建内部表时,会将数据移动到数据仓库指向的路径;若创建外部表,仅记录数据所在的路径, 不对数据的位置做任何改变。在删除表的时候,内部表的元数据和数据会被一起删除, 而外部表只删除元数据,不删除数据。这样外部表相对来说更加安全些,数据组织也更加灵活,方便共享源数据。 创建外部表:create EXTERNAL table IF NOT EXIS原创 2016-10-12 22:27:23 · 6213 阅读 · 0 评论 -
hive存储格式
TEXTFILE默认格式,行存储,导入数据时直接把数据文件拷贝到hdfs的hive表目录(hive location),数据文件可先经过gzip等压缩,再导hive表(系统自动检查,执行查询时自动解压),但使用这种方式,hive不会对数据进行切分,从而无法对数据进行并行操作.优点:数据加载快(load数据快)缺点:数据读取时磁盘开销大,即查询效率低SEQUENCEFILE原创 2016-10-12 22:24:11 · 420 阅读 · 0 评论