熟悉Hive 实验1

实验题目

探索Hive-熟悉Hive-加载数据到Hive。

实验要求

编写HQL查询语句导入给定文本sample1.txt中的数据到HDFS的一个CSV表stock_data中
然后复制到序列表stock_data2中。

操作步骤

1.创建数据库
首先通过show databases命令查看已存在的数据库
然后使用create命令创建一个新的数据库,在本实验中命名为demo。
2.在Hive中使用刚创建的数据库
使用USE命令,将demo设置为当前使用的数据库。

3.创建表,stock_data以及stock_data2。
通过create table命令创建表。



查看建表结果,确保建表成功。

4.在表中加载数据
使用load data local inpath命令,加载本地系统中文件的数据,而不是HDFS中的。

5.将stock_data中的数据复制到stock_data2中。
最后通过insert overwrite命令,将stock_data2中的数据用stock_data中的数据覆盖掉。
当然,在本例中stock_data2中尚无数据。

实验结果


总结

等忙完这阵,来总结下Hive中的常见操作。
  • 0
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
实验五的目标是熟悉Hive的基本操作。Hive是一个数据仓库基础设施工具,它能够提供类似于传统数据库的查询和分析功能,同时也能处理大规模的数据集。 首先,我们需要搭建Hive的环境。通过在终端输入指令,下载并解压Hive软件包,然后进行一系列配置,包括指定Hadoop的位置和Hive的元数据存放的位置等。 之后,我们启动Hive服务,并通过终端登录到Hive命令行界面。在这个界面中,我们可以运行Hive查询语句以及执行一些基本操作。 接下来,我们可以创建自己的数据库,并在其中创建。在Hive中,可以通过创建一个外部或者一个内部来实现。外部在创建时只是一个指向数据存放位置的指针,而内部将数据复制到Hive的默认文件系统中。 在创建之后,我们可以向中导入数据。通过使用Hive的LOAD命令,我们可以将数据从外部数据源导入到Hive中。 之后,我们可以进行一些查询和分析操作。Hive提供了类似于SQL的查询语法,例如SELECT、WHERE和GROUP BY等。我们可以根据需求编写查询语句,并通过运行查询来获取结果。 除了基本的查询功能,Hive也支持一些高级功能,例如分区、排序和分桶等。这些功能可以在数据处理时提供更好的性能和灵活性。 最后,我们需要记得关闭Hive服务,以免占用资源。在终端中输入指令,即可关闭Hive。 总结来说,实验五是为了熟悉Hive的基本操作。我们通过搭建环境、创建、导入数据和运行查询等步骤,了解了Hive的使用方法和功能。掌握了这些基本操作后,我们就可以在实际的数据处理和分析工作中更好地利用Hive

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值