hive的使用及基本操作

最新推荐文章于 2023-06-02 15:30:17 发布

大数据盼盼

最新推荐文章于 2023-06-02 15:30:17 发布

阅读量190

点赞数

文章标签： hive sql 数据库

本文链接：https://blog.csdn.net/qq_66455465/article/details/130160457

版权

一、简介

Hive是基于Hadoop的一个数据仓库工具(离线)，可以将结构化的数据文件映射为一张数据库表，并提供类SQL查询功能，操作接口采用类SQL语法，提供快速开发的能力，避免了去写MapReduce，减少开发人员的学习成本，功能扩展很方便。

用于解决海量结构化日志的数据统计。本质是：将 HQL 转化成 MapReduce 程序

二、启动方式

需要先启动hdfs和yarn，hive数据最终保存在hdfs，

启动hive 在hive下运行 : nohup bin/hiveserver2 & 和 hive --service metastore 1>/dev/null 2>&1 & ，然后查看查看 netstat -tunl 是否启动成功；

三、基本的操作命令

1.查看数据库： show databases ; 查看表： show tables;

2.创建数据库：create database 数据库名;

3.删除数据库： DROP DATABASE IF EXISTS 数据库名（不建议操作）

4.使用数据：use 数据库名；

5.建表

create table if not exists user(
    id string,
    name string
) row format delimited  fields terminated by ",";

6.修改表

ALTER TABLE name RENAME TO new_name
ALTER TABLE name ADD COLUMNS (col_spec[, col_spec ...])
ALTER TABLE name DROP [COLUMN] column_name
ALTER TABLE name CHANGE column_name new_name new_type
ALTER TABLE name REPLACE COLUMNS (col_spec[, col_spec ...])

7.删除表

DROP TABLE [IF EXISTS] table_name;

8.导入数据

load data local inpath "data" into table compute_stats();

9.创建视图

 CREATE VIEW emp_30000 AS SELECT * FROM table> WHERE score>70;

四、IDEA 连接hive

大数据盼盼

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
hive的使用及基本操作

Hive是基于的一个数据仓库工具(离线)，可以将结构化的数据文件映射为一张数据库表，并提供类SQL查询功能，操作接口采用类SQL语法，提供快速开发的能力，避免了去写，减少开发人员的学习成本，功能扩展很方便。用于解决海量结构化日志的数据统计。本质是：将 HQL 转化成 MapReduce 程序。
复制链接

扫一扫