大数据
文章平均质量分 90
Danielka
这个作者很懒,什么都没留下…
展开
-
Kafka基本概念
3个特点 发布(写)和订阅(读)事件流,包括连续地将数据从其他系统输入和输出。 可以如你想要的那样长时间的、可靠地、经久地存储事件流。 在事件发生时或回顾时处理事件流。 组成 服务端 一些服务端来自储存层,被称为brokers 另一些运行 Kafka Connect来持续地输入和输出数据作为事件流使得Kafka可以与现有的如关系型数据库、或是其他kafka集群相整合。 ...原创 2022-04-15 19:01:28 · 1863 阅读 · 0 评论 -
Apache Impala
1. 简介 Impala 是Hadoop生态中的一个开源的、原生的分析数据库。 它的作用: 在Hadoop上做BI查询 Impala时延低、高并行的特点,非常适合做分析查询。弥补只能做批处理的Hive的不足。Impala支持多租户线性扩展。 统一的基础架构 使用Hadoop集群相同的文件、数据格式、元数据、安全、资源管理框架。不需要改变基础架构和做数据迁移备份。 快速的处理能力 使用和Hive相同的元数据和ODBC驱动。同样支持SQL,上手容易 不用造轮子。 企业级安全 Impala与原生Hadoop安全原创 2022-04-11 18:40:14 · 473 阅读 · 0 评论