Hive(一)

最新推荐文章于 2024-08-16 09:51:25 发布

DK_MCU

最新推荐文章于 2024-08-16 09:51:25 发布

阅读量265

点赞数

分类专栏：大数据

大数据专栏收录该内容

1 篇文章 0 订阅

订阅专栏

1、什么是hive

1、什么是`hive`

hive 基于hadoop 分布式文件系统hdfs 开发的一个ETL（从数据源抽取Extract，并清洗交互转换Transform到加载Load目的端的一个过程） 和数据仓储工具。hive 很容易执行很多操作

数据封装
ad-hoc 查询：一条语句查询可能进行的是不同的查询，见https://stackoverflow.com/questions/2460954/what-is-ad-hoc-query“>
大数据集的分析

1.1、hive 特点

hive 中首先建立数据库和表，然后再导入数据
hive 被设计用来管理和查询存储在表中的结构化数据
hive 使得用户脱离了复杂map reduce的编写,每条sql查询会被翻译成map reduce
hive 提供的sql叫做hsql
hive支持四种类型的文件：TEXTFILE, SEQUENCEFILE, ORC and RCFILE (Record Columnar File)

2、hive 结构

这里写图片描述

hive clients：提供不同的驱动给应用，便于和hive server交互
hive server：所有查询都需要经过hive server
Hive Storage and Computing：

3、hive 模式

本地模式：适用于只含一个datanode，数据很小

$ hive
$ hive> SET mapred.job.tracker=local;

map reduce模式：多节点datanode、数据分布在不同节点上

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

DK_MCU CSDN认证博客专家 CSDN认证企业博客

码龄15年

43: 原创

20万+: 周排名

33万+: 总排名

12万+: 访问

: 等级

1398: 积分

6: 粉丝

22: 获赞

6: 评论

27: 收藏

私信

关注

热门文章

分类专栏

最新评论

抓狂的c++错误:...which is of non-class type..
恺风: 这是编译器的问题，可以仍然使用g++，改为 SqliteOp sqliteOp{string(argv[1])}; 通过{}的方式，告诉编译器，这是初始化，而不是一个函数
抓狂的c++错误:...which is of non-class type..
Wormwaker 回复加州州长: +1
抓狂的c++错误:...which is of non-class type..
加州州长: 怎么修改的啊，我也遇到类似的问题了
抓狂的c++错误:...which is of non-class type..
qq_39813077: [code=csharp] SqliteOp sqliteOp(string(argv[1])); sqliteOp.print(); return 0; [/code] 去掉string 改为SqliteOp sqliteOp((argv[1]));
linux内核版本设置
ZzZz_ing: 你好，请问可以将内核版本降低到2.6.18吗？会不会出现问题？

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。