Hive
hikeys
这个作者很懒,什么都没留下…
展开
-
HIVE总结1(基础命令+数据类型)
Hive是一种数据仓库,保存了一些半结构化的数据(文本数据)。元数据数据-保存到mysql/debye(默认)数据库中。不支持update和delete语句。数据必须要保存到hdfs上,依赖于hadoop。 Hive一组类似于SQL的语句-MYSQL,当执行SQL语句 时,对应的生成MapReduce程序。用于解决:Java程序员开发MapReduce的难点,会SQL就可以开发MapR...原创 2018-08-11 17:22:05 · 3725 阅读 · 0 评论 -
Hive总结2(分区+分桶+查询)
Hive是一个数据仓库 ,保存的半结构化数据 文本。Hive不支持:事务,不支持索引(但可以通过分桶实现快速的查询,hash) 类似的分布的nosql(Not Only Sql数据库:hbase - Phoinex(凤凰) Hive的功能,就是做mapreduce。分区:就是在可控制的情况下,将数据放到不同的目录下。减小查询的范围。 并不能加快查询的速度。还是要查询所...原创 2018-08-11 17:32:01 · 4313 阅读 · 0 评论 -
Hive总结3(自定义函数,jdbc连接)
1.自定义UTF函数举例:实现add()函数1.继承一个类:UDF2.在里面开发多个重载的方法:evaluate()3.注册这个函数,将打包的jar包放到hdfs上4.通过create function创建这个函数,drop function删除这个函数,删除后会有缓存,在重新登陆一次。1.1新建maven项目添加依赖:<!-- https://mvnrepo...原创 2018-08-13 09:46:32 · 1100 阅读 · 0 评论