关于apache hive

ApacheHive是一个开源数据仓库系统,它利用Hadoop的HDFS存储数据并用MapReduce进行分析。Hive提供了一种类似SQL的查询语言HQL,使得用户可以方便地访问和分析大规模数据集,降低了开发人员编写复杂MapReduce程序的需求,从而减少了学习和开发成本。
摘要由CSDN通过智能技术生成

1apache hive大数据时代的数据仓库软件;开源数据仓库系统

 借助hadoop实现了存储数据和分析数据;利用HDFS存储数据,MapReduce查询分析数据;

apache hive 可以将存储在hadoop文件中的结构化半结构化数据映射为一张数据表,基于表提供了一种查询模型,Hive查询语言,访问和分析存储在hadoop中的大型数据集

 hive的核心是将HQL转换为MapReduce程序,然后将程序提交到hadoop群集执行

2使用hive的好处

采取的语言类似SQL,简单易上手

避免直接写mapreduce程序,减少开发人员学习成本

3数据文件和表之间的映射,是指数据文件和表的对应关系

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值