Hive基础知识

1.hive特别适合数据仓库程序,对于数据仓库程序不需要实时响应查询,不需要记录级别的插入、更新和删除

2.hive实现word count程序

  CREATE TABLE docs(line STRING);

  LAOD DATA INPAT 'docs' OVERWRITE INTO TABLE docs;

  CREATE TABLE word_counts as

  select word,count(1) as count from

    (select explode(split(line,'\s')) as word from docs) w

  group by word  order by word;

 3. hive中执行bash shell命令

     如:!/bin/echo "what up god";

4.查询的时候打印出字段的名称设置 :

    set hive.cli.print.header=true;

    select * from ur_sms limit 3;

5.hive中的基本数据类型

数据类型

长度

例子

TINYINT

1byte有符号整数

20

SMALLINT

2byte有符号整数

20

INT

4byte有符号整数

20

BIGINT

8byte有符号整数

20

BOOLEAN

布尔类型,true或者false

TRUE

FLOAT

单精度浮点类型

3.1419

DOUBLE

双精度浮点数

3.14159

STRING

字符序列,单引号或双引号

‘hello tom ’,”hello world”

TIMESTAMP(V0.8.0+)

整数、浮点数或者字符串

 

BINARY(v0.8.0+)

 字节数组

复杂类型

6.创建表指定其他的分割符:

  create table if not exists employees(

    name STRING,

    salary FLOAT,

    subordinates ARRAY<STRING>,

    deductions MAP<STRING,FLOAT>,

    address STRUCT<street:STRING,city:STRING,state:STRING,zip:INT>

    )

    ROW FORMAT DELIMITED

    FIELDS TERMINATED BY '\001'

    COLLECTION ITEMS TERMINATED BY '\002'

    MAP KEYS TERMINATED BY '\003'

    LINES TERMINATED BY '\n'

    STORED AS TEXTFILE;

7.读时模式
     传统数据库是写时模式(schema on write),数据在写入数据库时对数据模式进行检查。Hive是在数据查询时进行模式验证,而不是加载的时候验证。

 

 

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值