hive
SkyingData
心如止水 波澜不惊
越秃越强
展开
-
Hive系列之Hive架构设计原理
文章目录一.Hive基本使用二. Hive架构设计三. Hive运行流程详解一.Hive基本使用切换到可以操作hive的用户直接输入hive回车,进入hive cli常用命令使用查看所有数据库:show databases;创建数据库tianliangedu,即为create database tianliangedu选择数据库设置显示当前所在数...原创 2020-02-12 21:05:21 · 183 阅读 · 0 评论 -
Hibv 系列之Hive概述
一Hive概述专业定义英文名称为Data Warehouse,可简写为DW。是为企业所有级别的决策制定过程,提供所有类型数据支持的战略集合。它是单个数据存储,出于分析性报告和决策支持目的而创建。为需要业务智能的企业,提供指导业务流程改进、监视时间、成本、质量以及控制。通俗解释面向分析的存储系统(面向数据分析的存储系统)一个面向主题的(Subject Or...原创 2020-02-12 20:52:13 · 447 阅读 · 0 评论 -
数据开发类-数据仓库开发类项目主要流程(中小型)
1.需求描述具体要做什么东西1.输入2.处理3.输出2.需求分析.是否具备可行性.输入.处理.输出3.开发步骤分析1.搭数据仓库类项目的开发骨架Create : 把创建相关代码Shell放入其中Config : 把相关配置参数放入其中UDF : 放入相关的依赖的第三方jar包Deal : 主要存放当前项目的处理数据的shell脚本(全部脚本)2...原创 2020-02-12 10:33:34 · 429 阅读 · 0 评论 -
Hive中 order by 和 sort by 的 区别
1. Order by排列出来的数据是 全局有序 但只有一个 分区2. Sort by排列出来的数据是 局部有序 同一个 分区内 不同分区之间没有关系原创 2020-02-10 10:19:16 · 1435 阅读 · 0 评论