ubuntu+Flink1.16.3+本地模式

pzy0668

已于 2024-05-20 10:48:33 修改

阅读量471

点赞数 4

文章标签： ubuntu linux 运维 flink

于 2024-05-20 10:47:23 首次发布

本文链接：https://blog.csdn.net/pzy0668/article/details/139058704

版权

flink1.18以上需要 jdk11，因此下载稍低的版本flink1.16.3 Downloads | Apache Flink

Flink有三种安装模式，本地模式， Standalone Cluster集群部署， Flink On Yarn。生产环境用on Yarn比较多，简单学习用本地模式即可。

解压安装

将文件放到/home/peng/software

tar -xvf flink-1.16.3-bin-scala_2.12.tgz

创建软链接

ln -s flink-1.16.3   flink

启动本地集群

进入flink安装目录并启动本地集群

cd  flink
./bin/start-cluster.sh

运行自带示例

使用自带的实例，快速部署作业到运行的集群上

 ./bin/flink run  examples/streaming

查看运行结果

（注意名字peng等）

tail log/flink-*-taskexecutor-*.out

我电脑是：

tail log/flink-peng-taskexecutor-0-ubuntu.out

网页端查看作业状态

通过 Flink 的 Web UI 来监视集群的状态和正在运行的作业，localhost:8081查看

关闭集群

./bin/stop-cluster.sh

注意参考自：本地模式安装 | Apache Flink

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

pzy0668

关注关注

4
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
ubuntu+Flink1.16.3+本地模式

flink本地模式
复制链接

扫一扫

flume+kafka+flink+mysql数据统计

04-20

本文将深入探讨这些技术及其在"flume+kafka+flink+mysql数据统计"中的应用。首先，Flume 是 Apache Hadoop 的一个子项目，主要用于收集、聚合和移动大量日志数据。在本场景中，Flume 可以从 Nginx 服务器收集 Web ...

Flink 配置1：Ubuntu 环境下部署 Flink 集群环境

北_鱼的博客

09-20

861

Ubuntu 环境下配置 Flink 分布式环境

参与评论您还未登录，请先登录后发表或查看评论

flink的安装与使用（ubuntu）

qq_38152400的博客

11-01

1424

flink的安装与使用（ubuntu）

在Ubuntu20.04部署Flink1.17实现基于Flink GateWay的Hive On Flink的踩坑记录（一）

云来山更佳，云去山如画

05-22

1652

在Ubuntu20.04部署Flink1.17实现基于Flink GateWay的Hive On Flink。DDL可以正常使用

ubuntu启用本地Flink集群

努力学习中

03-11

482

1：安装ubuntu，安装方式安装方式 2：在Oracle官网下载flink-1.10.1-bin-scala_2.12.tgz 3：找到你安装的linux系统的文件地址，在rootfs下有很多文件，把flink-1.10.1-bin-scala_2.12.tgz拷贝到opt文件下我的地址如下，大家的应该前面不一样，后面都是一样的 C:\Users\AppData\Local\Packages\CanonicalGroupLimited.UbuntuonWindows_79rhkp1fndgsc\Loc

ubuntu虚拟机下Pyflink环境搭建与集群使用

weixin_43502315的博客

05-28

1239

为了能更方便的开发flink应用, 笔者决定使用python+flink进行代码开发,然而中文论坛上很难找到一个详细的教程在ubuntu上配置一个pyflink集群,用于提交python脚本执行任务。笔者在提交pyflink任务的时候踩了很多坑，最后终于配好了框架并且能够提交python任务，归根结底造成这些困难的原因还是环境没搭好,希望这篇文章能够给初学者带来一些帮助,节省时间快速入门。

环境搭建+kafka+flink

12-24

环境搭建+kafka+flink 环境搭建是指在服务器上安装和配置各种软件环境，以满足项目的需求。在这个过程中，需要安装JDK、Kafka、Flink、Redis等软件，并进行相应的配置。一、JDK环境搭建 1. 下载JDK安装包，并将...

基于Flink+FlinkCDC+FlinkSQL+Clickhouse构建实时数据仓库课程

10-26

在构建实时数据仓库的过程中，Flink、FlinkCDC、FlinkSQL和Clickhouse这四个关键技术起着至关重要的作用。本文将深入探讨这些技术，并结合2022年新课中的内容，详细介绍如何利用它们构建高效的实时数据处理系统。 ...

基于Flink+FlinkCDC+FlinkSQL+Clickhouse构建实时数据仓库（2022新课，基于flink1.14）

12-27

《基于Flink+FlinkCDC+FlinkSQL+Clickhouse构建实时数据仓库》——本课程为大数据实时数仓项目实战课程，以大数据实时数仓项目为主线，理论和实战相结合，全方位、全流程、无死角讲解数仓项目的数仓基础、项目规划、...

Hadoop+数据流处理+Flink+教程

最新发布

07-11

### Hadoop+数据流处理+Flink+教程 #### 一、引言随着大数据时代的到来，数据处理成为了各个领域不可或缺的一部分。在这个背景下，Hadoop 和 Apache Flink 成为了处理大规模数据集的重要工具。Hadoop 提供了...

分布式flink平台搭建

03-05

ubuntu系统下部署完全分布式flink平台及与平台相关的zookeeper，kafka平台的安装部署过程及遇见的问题的解决方案

Ubuntu部署flink及简单使用

天然玩家的博客

08-23

4072

1 下载 1.0 基础环境 Ubuntu18.04 Java 1.8.0_191 Scala 2.12.9 1.2 下载flink 传送门:https://flink.apache.org/downloads.html 选择与scala版本对应的flink版本,测试选择1.9.0. 2 安装新建目录 cd /usr sudo mkdir flink cd flink 解压文件至...

flink 从入门到放弃 (一) ubuntu简单安装 Flink 集群

qq_33601179的博客

04-27

1038

废话单机版安装方式也很简单，下载下来，跑一下命令就行。集群方式……这里是在单个机器上的集群方式开搞 1. 装docker 略 2. 装个pip 安装 sudo apt-get install pip 检查 pip -v 3. 装个docker-compose 主要是通过pip来安装 sudo pip install docker-compose 检查 docker-compose -v 4. 下载flink镜像 doc...

ubuntu部署flink集群，运行wordcount 例子

A__stick的博客

01-31

992

说明：事先完成了以下的准备工作： ubuntu16 安装了hadoop集群（完全分布式） hadoop集群有六个节点：hadoop1~hadoop6 每个节点都安装了flink-1.12.0（略），flink有六个节点运行的代码jar包获取方式：在windows上的IntelliJ IDEA上编写代码，打包成jar包提交到ubuntu上的集群上运行运行flink自带的例子 @[TOC]1、standlone模式 @[TOC]1.1 standlone模式：独立的flink集群，不需要

Flink 的安装与基础编程

weixin_52439751的博客

03-08

1659

Apache Flink是一个分布式处理引擎，用于对无界和有界数据流进行有状态计算。Flink以数据并行和流水线方式执行任意流数据程序，它的流水线运行时系统可以执行批处理和流处理程序。此外，Flink 在运行时本身也支持迭代算法的执行。本文简要介绍了（单机与集群模式）Flink的安装以及基本编程方法，与如何通过使用Maven打包java程序后再通过虚拟机用flink语言调包使用。

Ubuntu22.04 pyflink的下载安装

weixin_927326的博客

11-02

488

Ubuntu22.04 pyflink的下载安装

Ubuntu Docker部署Flink+Kafka+zookeeper

山塘小鱼儿的博客

02-03

356

flink+zookeeper+Kafka

Flink在ubuntu环境下的集群部署

growing1224的博客

11-22

686

下载Flink安装包下载flink https://mirror.bit.edu.cn/apache/flink/flink-1.11.2/flink-1.11.2-bin-scala_2.12.tgz #镜像链接下载速度快服务器创建flink目录，上传到该目录然后解压缩 mkdirflink tar -xvfflink-1.11.2-bin-scala_2.12.tgz 添加一个专用用户,并附加管理员角色 #添加shower用户 sudo adduser shower #...

Spark+flink

08-16

### 回答1： Spark和Flink都是目前非常流行的大数据处理框架。 Spark是由Apache软件基金会开发的开源分布式计算系统，旨在提供快速的大规模数据处理和分析能力。Spark的核心组件是Spark Core，它提供了分布式任务调度、内存计算和数据处理能力。除了Spark Core之外，Spark还提供了Spark SQL、Spark Streaming、MLlib和GraphX等组件，可以支持各种不同的数据处理和分析任务。 Flink是由Apache软件基金会开发的开源流处理框架，它旨在提供实时、分布式的数据处理能力。Flink使用了一种称为“流计算”的技术，可以对数据进行流式处理，同时支持批处理和迭代计算。Flink还提供了Flink SQL、Flink Streaming和Flink ML等组件，可以支持各种不同类型的数据处理任务。尽管Spark和Flink都是大数据处理框架，它们的设计思想和实现方式有所不同，因此在不同的应用场景下可能会有不同的优缺点。例如，Spark在批处理方面表现优异，而Flink在流处理方面表现更为出色。 ### 回答2： Spark和Flink是两个非常流行的实时大数据处理框架。它们都可以用于分布式计算和处理大规模数据，但在某些方面却有所不同。 Spark是一个内存计算框架，它使用弹性分布式数据集（RDD）来进行计算。RDD是一个可并行操作的数据集合，它会被分割成多个分区并分布在不同的计算节点上。Spark提供了丰富的API和内置的库来支持各种大数据应用，如批处理、交互式查询和流式处理。Spark具有高效的执行引擎，可以在内存中快速处理数据，并通过缓存和数据共享来提高计算性能。此外，Spark还提供了Spark Streaming，使其能够处理实时数据流。而Flink是一个分布式流处理框架，它提供了低延迟、高吞吐量的流式计算功能。Flink使用流作为基本的数据处理单位，可以对数据流进行连续计算和转换。它支持事件时间和处理时间两种不同的时间概念，并提供了窗口操作和状态管理功能来处理有状态的计算。Flink还具备容错机制，可以自动恢复错误和故障，并支持精确一次的状态一致性。此外，Flink还可以将批处理和流处理结合在一起，实现一体化的数据处理。总之，Spark和Flink都是优秀的大数据处理框架，它们在内存计算、数据处理模型和特性方面略有不同。选择使用哪个框架取决于具体的应用场景和需求。如果处理的是批量数据且需要实时性较高，可以考虑使用Spark；而如果处理的是连续的实时数据流且对低延迟有较高要求，可以选择Flink。 ### 回答3： Spark和Flink是两个流行的大数据处理框架。Spark是一个基于内存的分布式计算框架，它提供了高级API用于批处理和流式处理。Spark的核心组件是Spark Core，它负责任务调度、数据分发和内存管理。除了Spark Core，Spark还提供了Spark SQL用于结构化数据处理、Spark Streaming用于实时数据处理、MLlib用于机器学习和GraphX用于图形计算。Spark能够通过将数据存储在内存中来提高计算效率，从而加快处理速度。相比之下，Flink是一个可扩展的流式处理引擎，它支持大规模的数据处理和分析。Flink提供了流式处理和批处理的统一API，这意味着它可以同时处理实时数据和历史数据。Flink具有一个称为DataStream的高级API，用于处理无界数据流，以及一个称为DataSet的API，用于批处理任务。 Flink的核心组件是分布式数据流引擎，它提供了支持容错、高吞吐量和低延迟的数据处理。Flink还提供了用于状态管理的机制，以及用于处理时间和窗口的工具。尽管Spark和Flink都是大数据处理框架，但它们在设计和用途上有一些区别。Spark更适合于交互式分析、机器学习和图计算等场景，而Flink则更适合于需要低延迟和准确性的实时数据处理任务。另外，Flink在容错性和事件时间处理方面做得更好，而Spark则更擅长于内存计算。选择使用哪个框架取决于数据处理的需求和场景，以及对延迟、内存管理和容错性的偏好。