hive-------32

Hive是基于Hadoop的数据仓库分析工具,提供SQL查询方式来分析HDFS中的数据。它适用于批量处理大量不可变数据,支持DDL、DML以及聚合函数等。本文介绍了如何创建内部表、外部表、分区表,以及展示了一些操作如添加列、重命名表和删除列。
摘要由CSDN通过智能技术生成

        Hive是基于Hadoop构建的一套数据仓库分析系统,它提供了丰富的SQL查询方式来分析存储在Hadoop分布式文件系统中的数据,可以将结构化的数据文件映射为一张数据库表,并提供完整的SQL查询功能,可以将SQL语句转换为MapReduce任务进行运行,通过自己的SQL去查询分析需要的内容,这套SQL简称Hive SQL,使不熟悉mapreduce的用户很方便的利用SQL语言查询,汇总,分析数据。而mapreduce开发人员可以把己写的mapper和reducer作为插件来支持Hive做更复杂的数据分析。

它与关系型数据库的SQL略有不同,但支持了绝大多数的语句如DDL、DML以及常见的聚合函数、连接查询、条件查询。

HIVE不适合用于联机(online)事务处理,也不提供实时查询功能。它最适合应用在基于大量不可变数据的批处理作业。

HIVE的特点:可伸缩(在Hadoop的集群上动态的添加设备),可扩展,容错,输入格式的松散耦合。

 

CREATE TABLE创建-一个指定名字的表。如果相同名字的表已经存在,则抛出异常;用户可以用IFNOT EXIST选项来忽略这个异常

EXTERNAL关键字可以让用户创建一个外部表,在建表的同时指定一个指向实际数据的路径(LOCATION)

LIKE允许用户复制现有的表结构,但是不复制数据

COMMENT可以为表与字段增加描述


创建简单表:create table table_name(id int,name string);

创建外部表: 

CREATE EXTERNAL TABLE table_name (viewTime INT, userid BIGINT,

pag

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值