初识HIVE(1)

本文探讨了Hive在数据仓库中的关键作用,包括其分布式查询、用户自定义功能、开源社区支持,以及与MapReduce在WordCount任务中的比较。Hive的元数据管理通过Metastore实现,并强调其在处理大规模数据方面的优势。此外,介绍了Hive的两种接口工具和工作模式。
摘要由CSDN通过智能技术生成

一、数据仓库

etl,hadoop,开源代码

二、HIVE的优势和特点

支持运行在不同计算平台
支持在HDFS和HBase的分布式查询系统
支持用户定义的函数,scripts,定制格式
JDBC和ODBC驱动
稳定和可靠(生产环境使用)
有一个很大开源社区
在这里插入图片描述

三、HIVE vs MapReduce-----Word Count

--Define metadata for the source
CREATE EXTERNAL TABLE lines(line STRING);
LOAD DATA INPATH 'book' OVERWRITE INTO TABLE lines;
--word count
SELECT word,count(*) as world_count
FROM lines
LATERAL VIEW explode(split(text,' ')) t1 as world
GROUP BY word;

HIVE代码时候实现大型数据

四、HIVE元数据管理

轻量级内嵌SQL数据库
Metastore
HIVE就像是飞机,处理大数据有优势,不适合小型数据
在这里插入图片描述

五、HIVE Interface-Console命令窗口模式

有两种工具:Beeline和命令行(CLI)
有两种模式:命令行模式和交互模式
在这里插入图片描述
在这里插入图片描述

在这里插入图片描述

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值