Kafka+Slipstream实现网站实时点击统计

最新推荐文章于 2021-11-08 09:21:02 发布

心明媚的很干净

最新推荐文章于 2021-11-08 09:21:02 发布

阅读量658

点赞数 1

分类专栏：大数据星环TDH Slipstream Linux 文章标签： Kafka TDH Slipstream

本文链接：https://blog.csdn.net/qq_28694119/article/details/86542493

版权

Kafka + Slipstream 实现网站点击量统计

实验目的

掌握StreamSQL的基本用法。
掌握Slipstream流处理的基本过程。
理解输入流表、衍生流表、结果表和流任务的关系。

Kafka topic 创建
创建输入流表
创建衍生流表
创建inceptor结果表，存储流数据处理结果
启动流任务
向Kafka topic 发送数据通过console producer 向kafka topic 发送数据
查看inceptor 结果表中的流处理结果

kafka topic 创建

cd TDH_Client/kafka/bin

./kafka-topics --create --topic topic_log_xueshen --zookeeper ip1:2181,ip2:2181,ip3:2181
--partitions 4 --replication-factor 2

./kafka-topic.sh --list --zookeeper ip1:2181,ip2:2181,ip3:2181

2 创建输入流表

create stream log_xueshen(ip string,url string,time timestamp) row format
delimited fields terminated by ',' 
tblproperties("topic"="topic_log_xueshen",
"kafka.zookeeper"="172.16.140.85:2181,172.16.140.86:2181,172.16.140.87:2181",
"kafka.