Hive-002

概述

上一篇讲了一些概念性的东西.
本章也会是概念性的东西.

Hive

Hive是 Hadoop数据仓库的工具. 可以将结构化的数据,映射为一张数据表.
并提供 SQL查询功能

本质

是将 SQL 转为 MapReduce 任务的工具.
是一个 MR Client

结构化

Hive可以将结构化的数据映射为一张和数据库表.
并提供SQL 操作 MR

例如

// access.txt
1.jack,12:30
2.tom,13:20
1.jack,15:20
2.tom,18:40

在这里插入图片描述

映射的表

create table t_access(id,name,date)

在这里插入图片描述

元数据

Hive的 元数据记录了 数据和表结构之间的映射

记录了表字段与文件之间的映射关系
表数据文件的存储位置

查询数据

使用 SQL语句 进行查询

select name,count(*) from t_access group by id;

在这里插入图片描述

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值