hive
热情的蘑菇
1.每天进步一丢丢,做个有趣的人
2.种一棵树最好时间是十年前,其次是现在
3.每个人都有一个觉醒期,但觉醒的早晚决定个人的命运
4.只有自己诚心待人,别人才有可能对自己以诚相待
5.普通并不等于庸俗。在许许多多普普通通的事情中,应该表现出不平常的看法和做法来。
展开
-
hive中动态表和静态表区别
虽然之前已经用过很多次hive的分区表,但是还是找时间快速回顾总结一下加深理解. 举个栗子,基本需求就是Hive有一张非常详细的原子数据表original_device_open,而且还在不断随着时间增长,那么我需要给它进行分区,为什么要分区?因为我想缩小查询范围,提高速度和性能. 分区其实是物理上对hdfs不同目录进行数据的load操作,0.7之后的版本都会自动创建不存在的hdfs的目录...转载 2019-01-04 12:03:51 · 1667 阅读 · 0 评论 -
通过jdbc连接hive
目前使用hive的方式主要有2种: a、仅把hive作为一个可以对文件使用sql查询的工具来使用,即常见的在hive客户端上,指定hive的metastore和hive的数据仓库目录(即hdfs目录),然后指定hadoop的目录以及相应执行的jar包即可,在命令行下调用: 1 mammut@classb-ds-bigdata16:~/apache-hive-1.2.1-bin$ bin...转载 2019-01-05 21:54:36 · 1830 阅读 · 0 评论 -
hive的用户和用户权限
HiverServer2支持远程多客户端的并发和认证,支持通过JDBC、Beeline等连接操作。hive默认的Derby数据库,由于是内嵌的文件数据库,只支持一个用户的操作访问,支持多用户需用mysql保存元数据。现在关心的是HiveServer如何基于mysql元数据库管理用户权限,其安全控制体系与Linux及Hadoop的用户是否存在联系。 1)remote方式部署Hive Hive中...转载 2019-01-07 20:13:18 · 381 阅读 · 0 评论 -
Hive官方手册翻译--hive事务
目录一、Hive 3的警告二、什么是ACID,为什么要使用ACID呢?三、限制四、流式API五、语法变化六、基本设计6.1、 基础目录和增量目录6.2、 紧缩器6.2.1、 增量文件紧缩6.3、 事务/锁管理器七、配置参数7.1、 事务的新配置参数7.2、 为INSERT,UPDATE,DELETE设置的参数7.3、 为紧缩设置的参数八、表属性 正文由 Alan Ga...转载 2019-01-29 10:35:51 · 1287 阅读 · 0 评论