锁屏面试题百日百刷-Hive篇(四)

最新推荐文章于 2024-07-16 09:56:04 发布

zjlala96

最新推荐文章于 2024-07-16 09:56:04 发布

阅读量246

点赞数

分类专栏：大厂面试题面试题百日百刷 Hive 文章标签： hive 大数据 hadoop

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/u012838765/article/details/129230023

版权

面试题百日百刷同时被 3 个专栏收录

84 篇文章 2 订阅

订阅专栏

大厂面试题

58 篇文章 0 订阅

订阅专栏

11 篇文章 0 订阅

订阅专栏

锁屏面试题百日百刷，每个工作日坚持更新面试题。锁屏面试题app、小程序现已上线，官网地址：https://www.demosoftware.cn/#/introductionPage。已收录了每日更新的面试题的所有内容，还包含特色的解锁屏幕复习面试题、每日编程题目邮件推送等功能。让你在面试中先人一步!接下来的是今日的面试题：

1.Hive导出数据的五种方式？

1. Insert方式，查询结果导出到本地或HDFS

Insert overwrite local directory ‘/root/insert/student’ select id,name from student;

Insert overwrite directory ‘/user/ insert /student’ select id,name from student;

2. Hadoop命令导出本地

hive>dfs -get /user/hive/warehouse/student/ 000000_0 /root/hadoop/student.txt

3. hive Shell命令导出

]$ bin/hive -e ‘select id,name from student;’ > /root/hadoop/student.txt

4. Export导出到HDFS

hive> export table student to ‘/user/export/student’;

1.Sqoop导出

2.Hive是怎样保存元数据的？

保存元数据的方式有：内存数据库rerdy，本地mysql数据库，远程mysql数据库，但是本地的mysql数据用的比较多，因为本地读写速度都比较快

内存数据库derby，安装小，但是数据存在内存，不稳定

mysql数据库，数据存储模式可以自己设置，持久化好，查看方便。

3.说说对Hive桶表的理解？

桶表是对数据进行哈希取值，然后放到不同文件中存储。

数据加载到桶表时，会对字段取hash值，然后与桶的数量取模。把数据放到对应的文件中。物理上，每个桶就是表(或分区）目录里的一个文件，一个作业产生的桶(输出文件)和reduce任务个数相同。

桶表专门用于抽样查询，是很专业性的，不是日常用来存储数据的表，需要抽样查询时，才创建和使用桶表。

4.什么是 metastore？

metadata 即元数据。包含 database、tabel、column names、partitions 信息、bucketing 信息等的元数据信息。元数据默认是存储在 Derby 中，建议存储在关系型数据库中。

5.Hive如何动态分区？

与分区有关的有两种类型的分区：静态和动态。在静态分区中，您将在加载数据时（显式）指定分区列。

而在动态分区中，您将数据推送到 Hive，然后 Hive 决定哪个值应进入哪个分区。要启用动态分区，请设置下面的属性：hive.exec.dynamic.parition.mode=nonstrict;

insert overwrite table emp_details_partitioned partition(location)

select * from emp_details;

6.如何创建 bucket 表？

默认情况下，在 Hive 中禁用分桶功能，可以通过设置下面的属性强制启用分桶功能：

hive.enforce.bucketing=true;

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
锁屏面试题百日百刷-Hive篇(四)

Hive导出数据的五种方式Hive是怎样保存元数据的说说对Hive桶表的理解什么是 metastoreHive如何动态分区如何创建 bucket 表
复制链接

扫一扫

专栏目录

zjlala96 CSDN认证博客专家 CSDN认证企业博客

码龄11年

92: 原创

10万+: 周排名

127万+: 总排名

4万+: 访问

: 等级

1283: 积分

41: 粉丝

6: 获赞

3: 评论

54: 收藏

私信

关注

热门文章

分类专栏

demo软件园 71篇
工具推荐使用 41篇
资源分享 55篇
电子书 36篇
大厂面试题 58篇
面试题百日百刷 84篇
java基础 8篇
spark 18篇
每日一题 12篇
Flink 11篇
kafka 2篇
HBase 8篇
学习路径 1篇
360度无死角学习路线 2篇
Flume 2篇
Hive 11篇
中间件 4篇
javaEE 7篇
网络编程 4篇
数据库 3篇
安卓开发 2篇

最新评论

面试题百日百刷-java基础篇(十一)
CSDN-Ada助手: 恭喜您入围持续学习7天榜单「2023-05-30」榜单, 连续学习: 7 天, 排名: 「4」, 一定要再接再厉哦, 争取拿到更好成绩, 榜单详情请看: https://bbs.csdn.net/topics/615602993 更多创作活动请看: 物联网技术正在如何影响我们的生活: https://activity.csdn.net/creatActivity?id=10421?utm_source=csdn_ai_ada_redpacket 新星计划2023: https://marketing.csdn.net/p/1738cda78d47b2ebb920916aab7c3584?utm_source=csdn_ai_ada_redpacket AI写作助手创作测评: https://activity.csdn.net/creatActivity?id=10450?utm_source=csdn_ai_ada_redpacket 全部创作活动: https://mp.csdn.net/mp_blog/manage/creative?utm_source=csdn_ai_ada_redpacket
每日分享(Thinphp开发的证书查询系统源码支持自适应多端PC+WAP含安装教程)
（）197: 安装教程在哪
Android核心技术之入门Hello world
我爱人工智能: 写的很详细

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。