博客专栏  >  云计算/大数据   >  hive-sql on hadoop技术

hive-sql on hadoop技术

hive-sql on hadoop技术

关注
2 已关注
8篇博文
  • hive的orc格式详解

    ORC(The Optimized Row Columnar),被设计用来给hive提供更高效的数据存储格式。和其它数据格式相比(parquest、text、rc),orc在读、写、处理数据上有着更优...

    2018-02-03 11:32
    1995
  • hive对接hbase(二)-hive中操作hbase

    hbase的查询比较简单,总得来看就是只有rowkey的定位。 在hbase的查询中可以使用scan来定位rowkey,使用filter来定位具体要查询的某个字段。 在hive对接hbase后,就...

    2018-02-01 20:57
    2376
  • hive对接hbase(一)-配置和使用例子

    1.配置 配置hive-site.xml,除了增加hive-hbase-handler-xxx.jar之外,在需要进行一些mapreduce计算的时候计算节点还需要hbase的jar来访问hbase...

    2018-01-17 14:12
    3189
  • hive对接phoenix

    1.配置 解压phoenix程序包,拷贝phoenix-xx-HBase-xx-hive.jar到hive的lib中 并配置hive-site.xml,增加phoenix-xx-HBase-xx-...

    2018-01-17 09:42
    3496
  • hive源代码开发(一)--开发调试环境搭建

    需要阅读hive源代码了解hive运行原理 修改hive部分代码来达到业务需求 可以将hive源代码下载下来进行编译运行,在本地进行调试。 1.环境准备 开发需要在linux环境下 可...

    2018-01-15 15:43
    3162
  • hive on spark安装(hive2.3 spark2.1)

    简介之前有写过hive on spark的一个文档,hive版本为2.0,spark版本为1.5。spark升级到2.0后,性能有所提升,程序文件的编排也和之前不一样,这里再更新一个最新的部署方式。 ...

    2017-11-01 18:18
    10290
  • hive on spark入门安装(hive2.0、spark1.5)

    简介 hive on hive是基于hadoop的数据仓库,hdfs为hive存储空间,mapreduce为hive的sql计算引擎。但是由于mapreduce很多计算过程都要经过硬盘读写等劣势,和s...

    2017-02-09 10:24
    7162
  • hive2安装

    简介hive是基于hadoop的hdfs和mapreduce的一个数据仓库。hdfs是hive的存储,mapreduce是hive的sql执行引擎。hive可以将结构化的数据文件映射为一张数据库表,并...

    2017-02-09 10:18
    4215
img博客搬家
img撰写博客
img发布 Chat
img专家申请
img意见反馈
img返回顶部