初识Hive

这篇博客介绍了Hive的基础操作,包括内部表和外部表的创建、数据导入、分区、以及SerDe的使用。还提到了Hive的数据类型和常用的数据导入方法,如LOAD DATA命令。此外,文中还涉及了Beeline和JDBC的使用。
摘要由CSDN通过智能技术生成

初识Hive

Hive 一种建立在Hadoop文件系统上的数据仓库架构,并对存储在HDFS中的数据进行分析与管理

Hive架构的核心 --将数据通过SQL语句转换成MapReduce操作/转成hdfs操作

数据仓库 --主要用来分析和管理数据,一般是查询操作,需要定期加载和刷新数据

元数据Metastore(表字段定义,属性,存放位置等除本身数据之外的信息)存储在关系型数据库(自建的mysql)中

Hive数据类型

: primitive_type 复杂类型

 | array_type

​ | map_type

 | struct_type	--结构体类型	eg:收货地址省市县...

:primitive_type 简单类型

 |TINYINT

​ | SMALLINT

​ | INT

​ | BIGINT

​ | BOOLEAN

​ | FLOAT

​ | DOUBLE

​ | STRING

DDL:表、字段的创建

DML:数据的增删改查操作

HIVE基本操作

数据展示

人员表
id,姓名,爱好,住址
1,小明1,lol-book-movie,beijing:xisanqi-shanghai:pudong
2,小明2,lol-book-movie,beijing:xisanqi-shanghai:pudong
3,小明3,lol-book-movie,beijing:xisanqi-shanghai:pudong
4,小明4,lol-book-movie,beijing:xisanqi-shanghai:pudong
5,小明5,lol-movie,beijing:xisanqi-shanghai:pudong
6,小明6,lol-book-movie,beijing:xisanqi-shanghai:pudong
7,小明7,lol-book,beijing:xisanqi-shanghai:pudong
8,小明8,lol-book,beijing:xisanqi-shanghai:pudong
9,小明9,lol-book-movie,beijing:xisanqi-shanghai:pudong

一、内部表简单操作

1 创建内部表及其基本设置

​ --创建内部表、设置分割符、导入数据

CREATE TABLE psn0(
id int,
name string,
likes ARRAY < string >,
address MAP < string,string >
)
ROW FORMAT DELIMITED
FIELDS TERMINATED BY ‘,’
COLLECTION ITEMS TERMINATED BY ‘-’
MAP KEYS TERMINATED BY ‘:’;

2 将本地文件中的数据导入表

#LOAD DATA [LOCAL] INPATH ‘filepath’ [OVERWRITE] INTO TABLE tablename;
LOAD DATA LOCAL INPATH ‘/root

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值