熟悉Hive 实验1

最新推荐文章于 2024-05-06 21:12:14 发布

magina507

最新推荐文章于 2024-05-06 21:12:14 发布

阅读量2.6k

点赞数

分类专栏：大数据处理实验报告文章标签：学习笔记大数据

本文链接：https://blog.csdn.net/magina507/article/details/51649797

版权

大数据处理同时被 2 个专栏收录

14 篇文章 0 订阅

订阅专栏

实验报告

14 篇文章 0 订阅

订阅专栏

实验题目

探索Hive-熟悉Hive-加载数据到Hive。

实验要求

编写HQL查询语句导入给定文本sample1.txt中的数据到HDFS的一个CSV表stock_data中

然后复制到序列表stock_data2中。

操作步骤

1.创建数据库

首先通过show databases命令查看已存在的数据库

然后使用create命令创建一个新的数据库，在本实验中命名为demo。

2.在Hive中使用刚创建的数据库

使用USE命令，将demo设置为当前使用的数据库。

3.创建表，stock_data以及stock_data2。

通过create table命令创建表。

查看建表结果，确保建表成功。

4.在表中加载数据

使用load data local inpath命令，加载本地系统中文件的数据，而不是HDFS中的。

5.将stock_data中的数据复制到stock_data2中。

最后通过insert overwrite命令，将stock_data2中的数据用stock_data中的数据覆盖掉。

当然，在本例中stock_data2中尚无数据。

实验结果

总结

等忙完这阵，来总结下Hive中的常见操作。

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

magina507

关注关注

0
点赞
踩
5

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

Hive 实验

lijie2049的博客

11-06

1485

//创建数据库并导入数据 1. create database{database_name}; 2.use{database_name}; 3. create table docs(line string); 4. load data inpath '/training/{student_name}/inceptor_data/wordcount' into table docs; //创建结果表 create table wc(word string, totalword int)...

Hive实验2

Sing___546的博客

10-18

472

Hive数据操作 1.向数据表中加载文件当数据被加载到表时，不会对数据进行任何变换，LOAD操作只是将数据复制到Hive表对应的位置。代码：LOAD DATA [LOCAL] INPATH 'filepath' [OVERWRITE] INTO TABLE table_name [PARTITION (partitioncol=val,...)] filepath可以是...

参与评论您还未登录，请先登录后发表或查看评论

hive实验报告.docx

03-14

完成Hive工具的安装和配置 Hive工具能够正常启动运行 Hive控制台命令能够正常使用够正常操作数据库，表，数据

hive使用心得

热门推荐

分布式应用与服务器架构专栏

02-18

2万+

最近使用hive一个多月下来(终于完成第一期数据分析迁移工作了)，当时使用的0.8的版本（现在最新版本是0.8.1），一个多月下来收获很多。从安装环境、调试、开发、业务理解、技术攻关、业务实现等，一一都体验了一把！总的来说，除了目前网上所介绍的常规hive使用和优化外。因为目前hive只支持0.20的相关版本，所以我们的环境还是使用的0.20版本的hadoop来进行搭建。使用hiv

大数据实验六实验报告：熟悉Hive的基本操作

06-20

“大数据技术原理与应用”课程实验报告题目：实验六：熟悉Hive的基本操作姓名：小猪猪日期：2022/5/15 1、实验环境：设备名称 LAPTOP-9KJS8HO6 处理器 Intel(R) Core(TM) i5-10300H CPU @ 2.50GHz 2.50 GHz 机带 RAM 16.0 GB (15.8 GB 可用) 主机操作系统 Windows 10 家庭中文版虚拟机操作系统 ubuntukylin-16.04 Hadoop 版本 3.1.3 JDK 版本 1.8 Java IDE：Eclipse 系统类型 64 位操作系统, 基于 x64 的处理器笔和触控没有可用于此显示器的笔或触控输入 2、实验内容与完成情况： 1.创建一个内部表 stocks，字段分隔符为英文逗号，表结构如下所示： stocks 表结构：

HIVE总结

xiaodi2016的博客

02-04

5952

一：hive作用 Hive是基于Hadoop的一个数据仓库工具，可以将结构化的数据文件映射为一张表，并提供类SQL查询功能。 Hive本质：将HQL转化成MapReduce程序（1）Hive处理的数据存储在HDFS （2）Hive分析数据底层的实现是MapReduce （3）执行程序运行在Yarn上 1.1：Hive优缺点 1>Hive支持用户自定义函数，用户可以根据自己的需求来实现自己的函数; 缺点： 1）Hive的HQL表达能力有限（1）迭代式算法无法表达（2）数

大数据技术基础实验报告-Hive安装配置与应用.doc

08-21

大数据技术基础实验报告-Hive安装配置与应用

大数据技术原理及应用课实验6 :熟悉Hive的基本操作

01-16

在这个实验中，我们将深入理解Hive的角色以及如何执行基本操作。首先，Hive在Hadoop生态系统中的角色是作为一个数据仓库接口，它简化了对分布式存储的大数据进行查询和分析的过程。Hive将复杂的MapReduce任务转化...

Hive总结.docx

06-12

Hive是基于Hadoop平台的数据仓库解决方案，它主要解决了在大数据场景下，业务人员和数据科学家能够通过熟悉的SQL语言进行数据分析的问题。Hive并不存储数据，而是依赖于HDFS进行数据存储，并利用MapReduce、Tez或...

【大数据基础实践】(六)数据仓库Hive的基本操作_熟悉hive的基本操作(1)

最新发布

2401_84185441的博客

05-06

717

解决方法：查看hadoop安装目录下 share/hadoop/common/lib 内 guava.jar 版本，查看 hive安装目录下lib内guava.jar的版本，如果两者不一致，删除版本低的，并拷贝高版本的。在表student_zqc中添加两个分区Dept=’CS’和Dept=’SE’，从本地导入数据到student_xxx表的两个分区中，分别查看两个分区所有记录，查看表数据存储目录；从HDFS导入数据到grade_xxx表中，查看grade_xxx表所有记录，查看表数据存储目录；

hive学习总结

weixin_39412870的博客

04-02

738

一、原理二、基本操作三、优化

Hive学习总结

qq_35522637的博客

07-22

1379

本文为Hive学习总结一、产生背景 1)MapReduce编程的不便性 2)HDFS上的文件缺少Schema 二、什么是Hive Hive是构建在Hadoop上的数据仓库,最初用于解决海量结构化的日志数据统计问题官网解释: The Apache Hive ™ data warehouse software facilitates reading, writing, and managing l...

第六次实验报告Hive

y的博客

05-20

2772

实验报告六：hive,mysql及其JDBC驱动的安装配置,Hive对数据库、表、视图的基本操作，wordcount程序的实现。（一）MySQL安装 1.网上下载mysql-server（yum安装） wget http://dev.mysql.com/get/mysql-community-release-el7-5.noarch.rpm 若wget不可用，就下载安装wget：yum -y ...

hive学习心得

和的博客

11-14

3405

前导 1.数据类型 a）基本数据类型 int（4字节，32位），float（4字节，32位），double（8字节，64位），boolean（true/false），补充：tinyint（1字节，8位），smallint（2字节，16位），bigint（8字节，64位），string 字符串，binary（二进制））， timestamp（时间戳），decimal，varchar，da

Hive个人心得笔记

LiuY521的博客

07-06

6878

Hive个人心得笔记一、Hadoop开发存在的问题只能用java语言开发，如果是c语言或其他语言的程序员用Hadoop，存在语言门槛需要对Hadoop底层原理，api比较了解才能做开发开发调试比较麻烦二、Hive概述 Hive是基于Hadoop的一个数据仓库工具。可以将结构化的数据文件映射为一张表，并提供完整...

Hive总结

星是河的眼的博客

01-16

3687

文章目录1. 概念2. Hive与Hadoop的关系3. Hive中的命令3.1 创建数据库并指定hdfs存储位置3.2 修改数据库3.3 查看数据库信息3.4 创建表并指定字段之间的分隔符4. Hive中的四种表结构4.1 内部表4.2 外部表4.3 分区表4.4 分桶表 1. 概念 Hive是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张数据库表,并提供类SQL查询功能(HQL). 其本质是将SQL转换为MapReduce的任务进行运算,底层由HDFS来提供数据的存储,说白了hiv

实验五熟悉 Hive 的基本操作

m0_52014276的博客

09-22

1830

（8）查询 stocks 表中收盘价(price_close)比开盘价(price_open)高得最多的那条记录的交易所 (exchange)、股票代码(symbol)、日期(ymd)、收盘价、开盘价及二者差价。（9）从 stocks 表中查询苹果公司（symbol=AAPL）年平均调整后收盘价(price_adj_close) 大于 50 美元的年份及年平均调整后收盘价。（10）查询每年年平均调整后收盘价(price_adj_close)前三名的公司的股票代码及年平均调整后收盘价。

hive学习心得二

和的博客

11-15

1486

4.HiveQl数据操作 a)像管理表中装载数据 insert overwrite table table_name partition(column_name='值1',column_name2='值2') select column_name from table_name; b)导出数据 1)hadoop fs -get /user/dim/dim_w3_gprs_product_

实验五:熟悉 hive 的基本操作

11-11

实验五的目标是熟悉Hive的基本操作。Hive是一个数据仓库基础设施工具，它能够提供类似于传统数据库的查询和分析功能，同时也能处理大规模的数据集。首先，我们需要搭建Hive的环境。通过在终端输入指令，下载并解压...