大数据技术之Hive基本操作及实验（四）

最新推荐文章于 2024-01-22 18:45:00 发布

小嘤嘤怪学

最新推荐文章于 2024-01-22 18:45:00 发布

阅读量869

点赞数 20

分类专栏： Hadoop 文章标签：大数据

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_63378697/article/details/135481213

版权

一、环境准备

1.首先在Linux本地新建/data/hivetest目录。

sudo mkdir -p /data/hivetest

2.切换到/data/hivetest目录下，使用wget命令，下载http://10.2.208.188:60000/allfiles/hive2中的cat_group文件

http://10.2.208.188:60000/allfiles/hive4中的goods_visit文件

cd /data/hivetest

sudo wget http://10.2.208.188:60000/allfiles/hive2/cat_group

sudo wget http://10.2.208.188:60000/allfiles/hive4/goods_visit

3.输入jps检查Hadoop相关进程，是否已经启动。若未启动，切换到/usr/local/hadoop/sbin目录下，启动Hadoop。

jps

cd /usr/local/hadoop/sbin

./start-all.sh

4.开启Hive，首先，需要保证Mysql启动。执行以下命令，查看Mysql的运行状态。

sudo service mysql status

输出显示Mysql未启动。执行以下启动命令。

sudo service mysql start

然后切换到/usr/local/hive/bin目录下，开启Hive。

cd /usr/local/hive/bin

./hive

二、Hive数据仓库准备

1.在Hive中创建一个数据仓库，名为DB。

create database DB;

2.以上简单创建了一个DB库，但是这条sql可以更进一步的优化，我们可以加上if not exists。

create database if not exists DB;

解析：在创建库时，应避免新建的库名与已有库名重复，如果库名重复将会报出以下错误（我在已有DB库的前提下，再次创建了DB库）。

错误提示数据仓库DB已经存在，那么加入的if not exists就起了作用，如下（在已有DB库的前提下，再次创建DB库，提示成功不会报错）

加入if not exists的意思是如果没有DB库就创建，如果已有就不再创建。

3.查看数据仓库DB的信息及路径。

describe database DB;

4.删除名为DB的数据仓库。

drop database if exists DB;

三、数据表操作

Hive的数据表分为两种：内部表和外部表。

Hive创建内部表时，会将数据移动到数据仓库指向的路径；若创建外部表，仅记录数据所在的路径，不对数据的位置做任何改变。在删除表的时候，内部表的元数据和数据会被一起删除，而外部表只删除元数据，不删除数据。这样外部表相对来说更加安全些，数据组织也更加灵活，方便共享源数据，生产中常使用外部表。

下面详细介绍对表操作的命令及使用方法：

即将创建的表，表名不能和已有表名重复，否则会报错，现在我们show tables一下，查看已

最低0.47元/天解锁文章

小嘤嘤怪学

关注

20
点赞
踩
20

收藏

觉得还不错? 一键收藏
打赏
0
评论
大数据技术之Hive基本操作及实验（四）

一、环境准备二、Hive数据仓库准备三、数据表操作四、Hive数据导出与导入五、三种常见的数据导出方式六、Hive词频统计
复制链接

扫一扫

专栏目录

小嘤嘤怪学 CSDN认证博客专家 CSDN认证企业博客

码龄3年

157: 原创

104万+: 周排名

4万+: 总排名

13万+: 访问

: 等级

3507: 积分

1516: 粉丝

1933: 获赞

7: 评论

1504: 收藏

私信

关注

热门文章

分类专栏

Python 45篇
C++ 16篇
PHP 12篇
Hadoop 8篇
Linux 9篇
最优化方法 1篇
数据结构 4篇

最新评论

深度学习与神经网络实现分类实验
全栈小5: 文章结构严谨，每次阅读都能收获知识，感谢博主的分享，期待博主继续更新高质量文章，支持！【深度学习与神经网络实现分类实验，博主这篇文章，值得一看】
深度学习与神经网络实现分类实验
雪碧有白泡泡: 博文还是一样的好，谢谢你的分享
Python || 猴子吃桃
CSDN-Ada助手: 恭喜您写了第四篇博客，标题也很有趣味性。希望您能继续保持创作的热情，分享更多有价值的内容。下一步的创作建议是可以根据自己的兴趣和经验，结合读者的需求，选择合适的主题进行深入探讨。期待您的下一篇作品！ CSDN 会根据你创作的前四篇博客的质量，给予优秀的博主博客红包奖励。请关注 https://bbs.csdn.net/forums/csdnnews?typeId=116148 看奖励名单。
Python || 字符串去重并排序
CSDN-Ada助手: 非常感谢用户的持续创作，这篇博客也非常实用。恭喜用户成功实现字符串去重并排序的功能，这对于数据处理来说非常重要。接下来，建议用户可以进一步探究字符串的其他操作，如字符串拼接、查找、替换等等。期待用户更多的优秀作品！ CSDN 正在通过评论红包奖励优秀博客，请看红包流：https://bbs.csdn.net/?type=4&header=0&utm_source=ada，我们会奖励持续创作和学习的博主，请看：https://bbs.csdn.net/forums/csdnnews?typeId=116148
Python || 计算逆序数
CSDN-Ada助手: 恭喜你写了第一篇博客！计算逆序数是一个很不错的主题，希望你能够坚持下去，分享更多有用的内容。推荐【每天值得看】：https://bbs.csdn.net/forums/csdnnews?typeId=21804

大家在看

最新文章

2024

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

小嘤嘤怪学 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。