大数据物流项目：Kudu 操作命令（六）

AIMaynor

已于 2023-07-29 22:31:02 修改

阅读量534

点赞数

分类专栏： # 大数据物流项目 # Kudu 文章标签： big data java 分布式 spark 大数据

于 2021-07-11 10:15:45 首次发布

本文链接：https://blog.csdn.net/xianyu120/article/details/118651269

版权

大数据物流项目同时被 2 个专栏收录

27 篇文章 7 订阅 ¥69.90 ¥99.00

订阅专栏

Kudu

7 篇文章 0 订阅

订阅专栏

本文详细介绍了Kudu的操作命令，包括Java客户端创建Maven项目、操作Kudu表（创建、删除、插入、查询、更新、删除数据）、范围分区和多级分区。还探讨了Kudu与Spark的集成，展示了如何使用KuduContext创建和删除表，以及进行数据的CRUD操作。

摘要由CSDN通过智能技术生成

文章目录

Logistics_Day04：Kudu 的操作命令

Logistics_Day04：Kudu 的操作命令

1615814395734

01-[复习]-上次课程内容回顾

主要讲解：Kudu 存储引擎，类似HBase数据库，属于HBase和HDFS折中产品，既能够随机数据读写，又支持批量数据加载分析。

1、物流项目ETL流程
	三大业务板块
	1）、数据源Source，都是从Kafka消费交易业务数据
	2）、编写结构化流程序应用，消费数据Kafka数据，进行ETL存储到各个业务板块存储引擎，比如Kudu、ES等
	3）、开发相关业务板块应用程序
		- 离线报表和即席查询：Kudu、SparkSQL及Impala和Hue
		- 实时大屏和数据服务接口：ClickHouse、NodeJS&Vue、SpringCloud
		- 快递物流信息检索：Es、SpringCloud
		
2、Kudu 框架概述
	为什么要使用Kudu，解决什么问题？？&

了解本专栏