大数据从入门到实战——Hive基本查询操作(一)

本文介绍了Hive的三大基本查询操作,包括where条件筛选、group by数据分组以及join关联查询,是大数据初学者入门Hive的重要教程。
摘要由CSDN通过智能技术生成

第1关 where操作

----------禁止修改----------
create database if not exists db1;
use db1;

create table if not exists table1(
eduLevel_name string comment '学历',
company_name string comment '公司名',
jobName string comment '职位名称',
salary int comment '薪资',
city_code int comment '城市编码',
responsibility string comment '岗位职责',
workingExp string comment '工作经验'
)
row format delimited fields terminated by ','
lines terminated by '\n'
stored as textfile;
truncate table table1;
头哥Hive是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张数据库表,并提供SQL查询功能。Hive定义了类SQL的查询语言HiveQL,它允许熟悉SQL的开发者使用HiveQL语句查询Hadoop中的数据。下面是Hive的一些基本查询操作: 1. 创建表:可以使用CREATE TABLE语句来创建一个新的表,定义表的结构,包括列名和数据类型等。 ```sql CREATE TABLE IF NOT EXISTS employees ( emp_id INT, emp_name STRING, emp_salary DOUBLE, emp_dept STRING ) ROW FORMAT DELIMITED FIELDS TERMINATED BY ',' STORED AS TEXTFILE; ``` 2. 插入数据:使用INSERT语句可以向表中插入数据。 ```sql INSERT OVERWRITE TABLE employees SELECT * FROM employees_backup; ``` 3. 查询数据:使用SELECT语句来查询表中的数据,类似于SQL。 ```sql SELECT emp_id, emp_name, emp_salary FROM employees WHERE emp_dept = 'Sales'; ``` 4. 删除表:使用DROP TABLE语句可以删除一个已经存在的表。 ```sql DROP TABLE IF EXISTS employees; ``` 5. 加载数据:使用LOAD DATA语句将HDFS上的数据加载到Hive表中。 ```sql LOAD DATA INPATH '/path/to/input/data/' INTO TABLE employees; ``` 6. 更新数据:Hive不支持传统的UPDATE语句,通常需要使用其他方法来更新表中的数据,比如通过创建新表或者使用MapReduce作业。 7. 删除数据:同样,Hive不支持传统的DELETE语句,通常使用分区和数据删除技术来实现数据的删除。 ```sql ALTER TABLE employees DROP PARTITION (emp_dept = 'Sales'); ```
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值