Hadoop--Hive

最新推荐文章于 2022-11-03 09:50:05 发布

Fangxingt

最新推荐文章于 2022-11-03 09:50:05 发布

阅读量381

点赞数 1

1.实验数据集的下载与保存

2.查看user_log.csv前5条记录

3.删除第一行记录（字段名称）

4.启动HDFS，执行jps命令查看当前运行的进程

5.将本地文件系统中的user_log.csv上传到分布式文件系统HDFS中，查看前10条记录

6.启动Hive，创建数据库dbtaobao

创建外部表

CREATE EXTERNAL TABLE dbtaobao.user_log(user_id INT,item_id INT,cat_id INT,merchant_id INT,brand_id INT,

month STRING,day STRING,action INT,age_range INT,gender INT,province STRING)

 COMMENT 'Now create dbtaobao.user_log!' ROW FORMAT DELIMITED FIELDS TERMINATED BY ',

' STORED AS TEXTFILE LOCATION '/dbtaobao/dataset/user_log';

成功将数据导入至数据仓库中，查询10行数据

使用使用dbtaobao数据库

use dbtaobao;

显示数据库中的表

show tables;

查看表的各种属性

show create table user_log;

查看表的简单结构

查看前十个交易日志的商品品牌

前20个交易日志的购买时间和商品种类

利用嵌套语句（简化操作）查询

7.统计分析

(1)用聚合函数count()计算表内有多少条行数据

执行结果为OK下的数字10000。

(2)在函数内部加上distinct，查出uid不重复的数据条数。

执行结果为358

(3)查询不重复的数据有多少条

8.关键字查询分析

(1)查询有多少人购买了商品

若给定时间和给定品牌，求当天购买的此品牌商品的数量

9.用户行为分析

给定购买商品的数量范围（例如超过10次），查询某一天在该网站的购买该数量商品的用户id

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

Fangxingt

关注关注

1
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

Hadoop 之 hive 学习

lfw2016的博客

06-01

1598

1. hive介绍 Hive 是建立在Hadoop上的数据仓库基础构架。它提供了一系列的工具，可以用来进行数据提取转化加载（ETL），这是一种可以存储、查询和分析存储在 Hadoop 中的大规模数据的机制。Hive 定义了简单的类 SQL 查询语言，称为 QL ，它允许熟悉 SQL 的用户查询数据。同时，这个语言也允许熟悉 MapReduce 开发者的开发自定义的 map

Hive学习笔记（HiveQL数据查询基础）

qq_50834939的博客

11-30

2484

Hive学习笔记（HiveQL数据查询基础）HiveQL数据查询语句SELECT语句WHERE语句GROUP BY语句HAVING分组筛选ORDER BY语句和SORT BY语句HiveQL查询语句JOIN语句 HiveQL数据查询语句 SELECT语句 SELECT语法结构如下： SELECT */field1,field2....FROM tableName, 例：sogo表中结构信息如下：查询sogo总条数代码： hive>SELECT cout(*) FROM sogo.sogo; 查

参与评论您还未登录，请先登录后发表或查看评论

hivesql

wanquan2001的博客

11-03

2721

13485646546

Hive和MySQL分组排序取前n条记录

u011250186的博客

09-10

2460

实例需求有一张职员信息表test（id，姓名，部门，入职时间），要求：查询出各部门最早入职的职员信息，表数据如下图： Hive实现语法：row_number() over (partition BY 字段A order by 字段B desc) partition by：类似hive的建表，分区的意思； order by ：排序，默认是升序，加desc降序；这里按字段A分区，对字段B进行降序排序引用上面语法（按部门分组，按时间正序排序）查询row_num，查询语句： SE...

Hive基本查询

zhaoxiaoba123的博客

09-02

1504

全表查询 select * from emp; 选择特定列查询 select empno, ename from emp; 注意: (1)SQL 语言大小写不敏感 (2)SQL 可以写在一行或者多行 (3)关键字不能被缩写也不能分行 (4)各子句一般要分行写 (5)使用缩进提高语句的可读性列别名: 重命名一个列、便于计算、紧跟列名，也可以在列名和别名之间加入关键字‘AS’ 案例：select ename AS name, deptno dn from emp; 算术运算符..

elasticsearch-hadoop-hive-2.3.4.jar包下载

03-22

elasticsearch-hadoop-hive-2.3.4.jar包下载

Docker(Hadoop-3.3.1+HBase-2.4.16+Zookeeper-3.7.1+Hive-3.1.3)配置文件

最新发布

03-21

Docker(Hadoop_3.3.1+HBase_2.4.16+Zookeeper_3.7.1+Hive_3.1.3 )配置文件搭建集群环境

mongo-hadoop-hive-2.0.2.jar

01-26

本JAR包用于把Mongo数据抽取到hive种对表字段的映射，如果没有这个包，是无法映射的

vagrant-hadoop-hive-spark：Vagrant项目启动运行当前版本的Hadoop，Hive和Spark的单节点VM

02-06

在这个名为 "vagrant-hadoop-hive-spark" 的项目中，它被用来构建一个包含Hadoop、Hive和Spark的单节点虚拟机（VM），这对于学习、测试或开发大数据处理应用程序非常有用。下面将详细介绍这些组件以及它们在项目中的...

mongo-hadoop-hive-2.0.0

10-12

mongo-hadoop-hive-2.0.0.jar xx cc vvs . dd s . s ww w .

查询前几条记录

03-17

NULL 博文链接：https://tanghaidi.iteye.com/blog/487512

林子雨案例----淘宝伪数据分析

qq_36125181的博客

01-23

5725

淘宝双11数据分析与预测准备工作：软件工具本案例所涉及的系统及软件： Linux系统（CENTOS 7） MySQL Tomcat（7.0.9） Hadoop（3.2.0） Hive（2.3.5） Sqoop（1.4.6） ECharts（4.5.0） Idea（2019.1.3） Spark（2....

hive如何取出数据的前几个元素

cclovezbf的博客

02-21

5057

今天遇到个问题，例如 select company_name,concat_ws(',',collect_set(contract_num)) contract_nums from table group by contract_num 如果这个contract_nums数量有100个，我只显示5个。那么怎么办呢？ 1.基础版 select concat_ws(",", array( array('1','2','3','4','5','6','7','8','9','10'

hive数据仓库用户行为分析的简单实践

hsx15777894525的博客

09-19

2508

步骤一创建数据库仓库导入数据对small_user.csv数据进行预处理然后得到user_table.txt Hdfs下创建bidata/dataset目录将本地的hongshixing_table.txt上传到hdfs 查看数据在hive中创建数据库创建外部表在hive中查看数据步骤二进行 hive数据分析查看表结构简单查询分析 1、用聚合函数 count()计算出表内有多少条行数据 2、在函数内部加上 distinct,查出 uid 不重复的数据有多少条 3、查询

关于Hive数据查询的18种方

zjjcchina的博客

12-20

1162

我们本期内容大部分HQL操作都需要依赖如下两张表，具体的数据内容如下： course student 1、SELECT查询语句 SELECT 查询语句比较简单，后面跟要查询的字段，如下所示： hive (hypers)> select name from student; OK name Rose Jack Jimmy Tom Jerry 可以为查询语句中的列和表加上别名，如下所示： hive (hypers)> select t.name ...

Hadoop-练习利用hive进行数据查询

yumingzhu1的博客

06-10

6265

1 准备测试数据问题1：求各个部门的总工资问题2：求各个部门的人数和平均工资问题3：求每个部门最早进入公司的员工姓名问题4：求各个城市的员工的总工资问题5：列出工资比上司高的员工姓名及其工资问题6：列出工资比公司平均工资要高的员工姓名及其工资问题7：列出名字以J开头的员工姓名及其所属部门名称问题8：列出工资最高的头三名员工姓名及其工资问题9：将全体员工按照总收入（工资+...

hive表信息查询：查看表结构、表操作等