Apache Storm：实时流数据处理的强力引擎

本文链接：https://blog.csdn.net/m_main/article/details/138462149

在当今数字化世界中，数据以惊人的速度产生和流动。处理这些实时数据流变得至关重要，而Apache Storm正是为此而生。

什么是 Apache Storm？

Apache Storm 是一个开源的、分布式的实时流数据处理系统。它允许您处理海量数据流，几乎实时地进行分析、处理和计算。让我们来看看它是如何工作的。

如何工作？

Storm 中有两个主要概念：Spouts 和 Bolts。

Spouts: 负责从数据源获取数据，并将其发送给 Storm 拓扑结构。例如，一个 Spout 可以从 Twitter 获取实时推文数据。
Bolts: 接收来自 Spouts 的数据流，并执行各种操作，例如过滤、转换、聚合等。每个 Bolt 都是拓扑结构中的一个处理步骤。

让我们来看一个简单的 Storm 拓扑结构示例，它从 Kafka 主题获取数据，执行一些简单的处理，然后将结果写入另一个 Kafka 主题：

import org.apache.storm.Config;
import org.apache.storm.LocalCluster;
import org.apache.storm.topology.TopologyBuilder;
import org.apache.storm.kafka.bolt.KafkaBolt;
import org.apache.storm.kafka.spout.KafkaSpout;
import org.apache.storm.kafka.spout.KafkaSpoutConfig;

public class SimpleStormTopology {
    public static void main(String[] args) {
        // 设置 Kafka 服务器地址和端口
        String bootstrapServers = "localhost:9092";
        // 设置输入 Kafka 主题
        String inputTopic = "input-topic";
        // 设置输出 Kafka 主题
        String outputTopic = "output-topic";

        // 创建 Kafka Spout 配置
        KafkaSpoutConfig<String, String> kafkaSpoutConfig = KafkaSpoutConfig.builder(bootstrapServers, inputTopic)
                .build();

        // 创建拓扑构建器
        TopologyBuilder builder = new TopologyBuilder();
        // 将 Kafka Spout 添加到拓扑结构中，用于从 Kafka 主题获取数据流
        builder.setSpout("kafka-spout", new KafkaSpout<>(kafkaSpoutConfig));
        // 将数据处理 Bolt 添加到拓扑结构中，用于处理从 Kafka Spout 接收到的数据流
        builder.setBolt("processing-bolt", new ProcessingBolt()).shuffleGrouping("kafka-spout");
        // 将 Kafka Bolt 添加到拓扑结构中，用于将处理后的数据写入另一个 Kafka 主题
        builder.setBolt("kafka-bolt", new KafkaBolt<String, String>()
                .withProducerProperties(new Props().put("bootstrap.servers", bootstrapServers))
                .withTopicSelector(new DefaultTopicSelector(outputTopic))
                .withTupleToKafkaMapper(new FieldNameBasedTupleToKafkaMapper<>("key", "value"))
        ).shuffleGrouping("processing-bolt");

        // 创建 Storm 配置对象
        Config config = new Config();
        // 创建本地 Storm 集群
        LocalCluster cluster = new LocalCluster();
        // 将拓扑结构提交到本地 Storm 集群中运行
        cluster.submitTopology("simple-topology", config, builder.createTopology());
    }
}