hive
文章平均质量分 82
小阿泰
这个作者很懒,什么都没留下…
展开
-
Hive总结(二) Hive导入时,格式不对错误
本地load data到Hive表中,可能会由于一些表格式的问题或文本格式问题,导致上传失败。 总结原因: 1. 上传格式和建表格式不匹配 自己上传的为txt文本,而创建表指定的file format 是sequencefile。 [java] view plain copy hive> load data local转载 2016-10-28 10:49:15 · 4314 阅读 · 1 评论 -
Hive总结(一) Hive四种数据导入方式
Hive的几种常见的数据导入方式 这里介绍四种: (1)、从本地文件系统中导入数据到Hive表; (2)、从HDFS上导入数据到Hive表; (3)、从别的表中查询出相应的数据并导入到Hive表中; (4)、在创建表的时候通过从别的表中查询出相应的记录并插入到所创建的表中。 一、从本地文件系统中导入数据到Hive表 先在Hive里面创建好表,如下:转载 2016-10-28 10:01:11 · 351 阅读 · 0 评论 -
Hadoop之HDFS文件操作
HDFS是一种分布式文件系统,为MapReduce这种框架下的海量数据分布式处理而设计。 Hadoop之HDFS文件操作常有两种方式,一种是命令行方式,即Hadoop提供了一套与Linux文件命令类似的命令行工具;另一种是JavaAPI,即利用Hadoop的Java库,采用编程的方式操作HDFS的文件。 方式一:命令行方式 Hadoop文件操作命令形式为 hadoop fs转载 2016-11-22 08:54:25 · 291 阅读 · 0 评论 -
让你彻底明白hive数据存储各种模式
问题导读 1.hive数据分为那两种类型? 2.什么表数据? 3.什么是元数据? 4.Hive表里面导入数据的本质什么? 5.表、分区、桶之间之间的关系是什么? 6.外部表和表的区别是什么? Hive的数据分为表数据和元数据,表数据是Hive中表格(table)具有的数据;而元数据是用来存储表的名字,表的列和分区及其属性,表的属性(是否为外部表等),表的数据所在目转载 2016-12-07 14:38:05 · 510 阅读 · 0 评论 -
hive内部表与外部表区别详细介绍
问题导读: 1.创建内部表与外部表的区别是什么? 2.external关键字的作用是什么? 3.外部表与内部表的区别是什么? 4.删除表的时候,内部表与外部表有什么区别? 5.load data local inpath '/home/wyp/data/wyp.txt' into table wyp;的过程是什么样子的? 6.磁盘,hdfs,hive表他们之间的过程是什么样子的?转载 2016-12-07 16:13:46 · 383 阅读 · 0 评论 -
让你真正明白什么是hive
导读: 对于一个事物的认识,存在几种情况 1.没有接触,不知道这个事物是什么,所以不会产生任何问题。 2.接触了,但是不知道他是什么,反正我每天都在用。 3.有一定的了解,不够透彻。 那么hive, 1.我们对它了解多少? 2.它到底是什么? 3.hive和hadoop是什么关系? 扩展: hbase和hive是什么关系? Hive最初是应Facebook每天产生转载 2016-12-07 14:12:53 · 279 阅读 · 0 评论