![](https://img-blog.csdnimg.cn/20201014180756928.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
Hive
heartless_killer
这个作者很懒,什么都没留下…
展开
-
hadoop系列十一 ——MapReduce案例分组求top n(对象覆盖问题)
需求:有如下数据(本案例用了排序控制、分区控制、分组控制)order001,u001,小米6,1999.9,2order001,u001,雀巢咖啡,99.0,2order001,u001,安慕希,250.0,2order001,u001,经典红双喜,200.0,4order001,u001,防水电脑包,400.0,2order002,u002,小米手环,199.0,3order00...原创 2019-10-19 17:05:37 · 309 阅读 · 0 评论 -
hadoop系列五 ——hive操作
创建库hive中有一个默认的库:库名: default库目录:hdfs://hdp20-01:9000/user/hive/warehouse新建库:create database databaseName;库建好后,在hdfs中会生成一个库目录:hdfs://hdp20-01:9000/user/hive/warehouse/db_order.db展示所有库的名字:show d...原创 2019-10-13 21:34:56 · 683 阅读 · 1 评论 -
hadoop系列四 ——hive基本概念
什么是HiveHive是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张数据库表,并提供类SQL查询功能。Hive 具有 SQL 数据库的外表,但应用场景完全不同,Hive 只适合用来做海量离线数 据统计分析,也就是数据仓库。本质是:将HQL/SQL转化成MapReduce程序1)Hive处理的数据存储在HDFS2)Hive分析数据底层的实现是MapReduce3)...原创 2019-10-13 15:55:42 · 393 阅读 · 1 评论