文章目录
- Logistics_Day04:Kudu 的操作命令
-
- 01-[复习]-上次课程内容回顾
- 02-[了解]-第6天:课程内容提纲
- 03-[掌握]-Java 操作 Kudu之创建Maven Project
- 04-[掌握]-Java 操作 Kudu之创建KuduClient实例
- 05-[掌握]-Java 操作 Kudu之创建表(Hash分区)
- 06-[掌握]-Java 操作 Kudu之删除表
- 07-[掌握]-Java 操作 Kudu之插入数据
- 08-[掌握]-Java 操作 Kudu之全量查询数据
- 09-[掌握]-Java 操作 Kudu之过滤查询数据
- 10-[掌握]-Java 操作 Kudu之更新及删除数据
- 11-[掌握]-Java 操作 Kudu之创建表(范围分区)
- 12-[掌握]-Java 操作 Kudu之创建表(多级分区)
- 13-[掌握]-Java 操作 Kudu之 添加列和删除列
- 14-[掌握]-Kudu 集成 Spark之创建Maven Project
- 15-[掌握]-Kudu 集成 Spark之创建表和删除表
- 16-[理解]-Kudu 集成 Spark之数据CRUD操作
- 17-[掌握]-Kudu 集成 Spark之DataFrame API
Logistics_Day04:Kudu 的操作命令
01-[复习]-上次课程内容回顾
主要讲解:
Kudu 存储引擎
,类似HBase数据库,属于HBase和HDFS折中产品,既能够随机数据读写,又支持批量数据加载分析。
1、物流项目ETL流程
三大业务板块
1)、数据源Source,都是从Kafka消费交易业务数据
2)、编写结构化流程序应用,消费数据Kafka数据,进行ETL存储到各个业务板块存储引擎,比如Kudu、ES等
3)、开发相关业务板块应用程序
- 离线报表和即席查询:Kudu、SparkSQL及Impala和Hue
- 实时大屏和数据服务接口:ClickHouse、NodeJS&Vue、SpringCloud
- 快递物流信息检索:Es、SpringCloud
2、Kudu 框架概述
为什么要使用Kudu,解决什么问题??&