九、Flink入门--SQL实战

本文介绍了Apache Flink的SQL实战,包括环境准备、实战演示五大需求:筛选纽约行车记录、计算乘客数量、区域车辆计数、数据写入Kafka及ES。详细阐述了如何使用UDF函数以及定义source和sink表,帮助理解Flink的实时数据处理能力。
摘要由CSDN通过智能技术生成

1.环境准备

下载代码并安装环境,前提是准备好Docker环境。

git clone git@github.com:ververica/sql-training.git
cd sql-training
docker-compose up -d

会先下载以来镜像,时间比较慢,耐心等待。
接下来进入sql-client

docker-compose exec sql-client ./sql-client.sh

2.实战演示

表定义,Rides表,类型是source表,更新模式为追加。

tables:
   - name: Rides #表名
    type: source #表类型
    update-mode: append #更新模式
    schema:
    - name: rideId #路线ID
      type: LONG
    - name: taxiId #出租车ID
      type: LONG
    - name: isStart #是否出发
      type: BOOLEAN
    - name: lon #经度
      type: FLOAT
    - name: lat #纬度
      type: FLOAT
    - name: rideTime #时间
      type: TIMESTAMP
      rowtime:
        timestamps:
          type: "from-field"
          from: "eventTime"
        watermarks:
          type: "periodic-bounded"
          delay: "6000
Flink是一种流处理框架,能够处理实时数据,并且支持事件驱动和持久性模式。Flink的发布让业界感到了像Apache Spark和Apache Storm等开源项目的冲击,Flink相比其它开源项目有更好的性能和更容易的维护性。针对Flink初学者,一本很好的参考书籍是《Flink入门实战》。 《Flink入门实战》是Apache Flink社区的一本官方教程,并且全书覆盖了Flink的基础和实践阶段。该书籍通过简单的例子讲解如何使用Flink的API编写流处理程序,并且演示了Flink在处理大型数据集时的能力。本书从在本地环境中搭建Flink集群开始,介绍了Flink的核心概念(如DataStream、Windowing、Table和SQL API等),并引导读者如何运用Flink实现一些常见的流处理应用程序,如实时的数据摄取、聚合和分析等。 该书籍不仅仅只是介绍Flink,还包含了一些其他实践的主题,比如如何使用Kafka和Hadoop等技术与Flink集成。此外,此书还涵盖了一些高级主题,如在Flink使用状态机和CEP来处理复杂事件。 总之,如果你是个初学者或者想要进一步研究流处理框架的开发人员,那么《Flink入门实战》就是一个很好的选择。这本书可以带你快速掌握Flink使用,掌握一些最佳实践和技巧,让你能够处理流数据,并使用其产生的信息来做出更好的业务决策。如果你有兴趣了解Flink,这本书值得一读。
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值