hive的基本语法与操作

hive的常用的交互式命令

  1. ‘-e’不进入hive的交互式窗口执行sql语句
bin/hive -e "select id from student"
  1. ’-f’执行脚本里的sql语句,先创建一个文件来存储sql语句,执行文件里的sql语句并且将执行的结果放到其他文件里
bin/hive -f /hive.sql > /result.txt
  1. 在hive cil命令窗口查看hdfs文件系统
dfs -ls /;
  1. 在hive cil命令窗口如何查看本地文件系统
! ls /data;
  1. 查看在hive输入的所有的历史命令
//进入当前用户的根目录/root或者/home/用户
//查看hivehistory文件
cat .hivehistory

hive类型转换

  • Hive的原子数据类型的是可以进行隐式转换的,类似于Java。TINYNT会自动转换成INT类型
  • 任何整式类型都可以转换为一个更广的类型,入TINYINT可以转换成INT类型,INT类型可以转换成BIGINT 类型
  • TINYINT、SMALLINT、INT都可以转换成FlOAT类型
  • 布尔类型不可以转换任何类型
  • cast强制类型转换

hive数据库与表的创建

创建数据库

  • 创建数据库
create database hive;
  • 创建数据库并且指定在hdfs中地址
create database hive location '/hive.db'
  • 数据库的强制删除
drop database hive cascade

创建表

建表语法

CREATE [EXTERNAL] TABLE [IF NOT EXIST] table_name
[(col_name data_type [COMMENT COL_COMMENT],.....)]
[COMMENT table_comment]
[PARTITIONED BY (col_name data_type [COMMENT col_comment],....)]
[CLUSTERED BY (col_name,col_name,....)]
[SORTED BY (col_name [ASC|DESC],...)] INFO num_buckets BUCKETS]
[ROW FORMAT row_format]
[STORED AS file_format]
[LOCATION hdfs_path]

字段解释

  • CREATE TABLE创建一个指定名字的表,如果名字相同抛出异常,用户可以使用IF NOT EXIST来忽略异常
  • EXTERNAL关键字可以创建一个外部表,在建表的同时指定一个实际数据的路径(LOCATION),hive在删除表的时候,内部表的元数据和数据会被一起删除,而外部表只删除元数据,不删除数据
  • COMMENT是为表和列添加注释
  • PARTITIONED BY是分区表
  • CLUSTERED BY 是建分桶
  • SORTED BY不常用
  • STORED AS 指定存储文件类型
  • LOCATION指定表在HDFS上的存储位置
  • LIKE允许复制现有的表结构但是不复制数据

建表时的分隔符的设置

//字段分隔符
fields terminated by '\t'
//array 类型成员分隔符
collection items terminated by ','
//map的Key和Value之间的分隔符
map keys terminated by ':'
//行分隔符,必须放在最后
lines terminated by '\n'

表读取数据

外部表读取本地数据

load data local inpath '/export/servers/hivedatas/student.csv' into table test;

读取数据并且覆盖

load data local inpath '/export/servers/hivedatas/student.csv' overwrite into table test;

读取hdfs上的数据

load data inpath '/hive/data/test' into table test;
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
Hive是一个基于Hadoop的数据仓库工具,它提供了类似于SQL的查询语言HiveQL来操作和查询数据。Hive的基本操作包括创建表、加载数据、插入数据、更新数据和删除数据等。而Hive的查询语法主要由select、from、join、where、group by、having、order by、sort by、limit、union和union all等关键字组成。\[3\]其中,select用于选择要查询的列,from用于指定要查询的表,join用于连接多个表,where用于设置查询条件,group by用于分组聚合,having用于设置分组条件,order by用于排序,sort by用于局部排序,limit用于限制查询结果的数量,union和union all用于合并查询结果。\[3\]此外,Hive还有一种特殊的join操作,即半开连接(left semi join),它是left join的一种优化形式,只能查询左表的信息,主要用于解决左表数据是否存在的问题。\[1\]在Hive中,还有一些优化技巧和配置参数可以用来提高查询性能,比如同比与环比练习、优化、配置参数和数据倾斜等方面的内容。\[2\] #### 引用[.reference_title] - *1* *3* [Hive基本查询语法](https://blog.csdn.net/u010711495/article/details/111773364)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v91^control_2,239^v3^insert_chatgpt"}} ] [.reference_item] - *2* [13-Hive的基本操作和查询语法以及案例](https://blog.csdn.net/weixin_50627985/article/details/125476193)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v91^control_2,239^v3^insert_chatgpt"}} ] [.reference_item] [ .reference_list ]
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值