hive简介--hive初步认识

Hive


  hive简介:

   Hive是基于hadoop的一个数据仓库基础架构,通过将结构化数据文件映射为一张数据库表,并提供简单的SQL查询功能,提供数据仓库的统计分析。Hive可以将SQL转化为MapReduce任务执行。Hive本身不存储数据,文件数据存储在hadoop兼容的文件系统中。Hive只保存元数据信息。Hive在数据加载过程中不会对数据进行任何的修改,只是将数据移动到hdfs中Hive指定的目录下。因此,Hive不支持对数据的修改和添加,所有数据都是加载的时候确定的,在读取的时候进行校验。Hive主要有一下特点:

1、支持索引,加快查询速度

2、支持多种存储类型

3、元数据信息保存在数据库中

4、可以直接使用hdfs文件系统中的数据

5、内置UDF韩式,用户可以自定义UDF函数


Hive支持的数据类型:

  hive支持基本数据类型和复杂数据类型两种数据类型:

基本数据类型:

  Integers:

  TINYINT - 1 byte

  SMALLINT - 2 byte
  INT - 4 byte
  BIGINT - 8 byte

  BOOLEAN:

  BOOLEAN - TRUE/FALSE

  Floating point numbers:

  FLOAT –单精度

  DOUBLE – 双精度

  String:

  STRING - sequence of characters in a specified character set

复杂数据类型:

     Structs:                             例子  {c INT; d INT}

      Maps (key-value tuples):. 例子'group' -> gid  M['group']
      Arrays (indexable lists):   例子[‘1', ‘2', ‘3']
      TIMESTAMP  0.8版本新加属性






  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值