Flink on Zeppelin-1

最新推荐文章于 2023-10-02 23:17:35 发布

000X000

最新推荐文章于 2023-10-02 23:17:35 发布

阅读量329

点赞数

分类专栏： Flink 文章标签： Flink Zeppelin

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/ytp552200ytp/article/details/107561227

版权

Flink 专栏收录该内容

24 篇文章 0 订阅

订阅专栏

准备工作

下载Zeppelin 0.9.0 preview1，或者下载

除了下载Flink的标准release，如果你要使用Flink on Yarn模式或者连接Hive，那么你还需要下载其他Flink组件。

flink-hadoop-compatibility (https://repo1.maven.org/maven2/org/apache/flink/flink-hadoop-compatibility_2.11/1.9.1/flink-hadoop-compatibility_2.11-1.9.1.jar)
flink-shaded-hadoop-2-uber (https://repo.maven.apache.org/maven2/org/apache/flink/flink-shaded-hadoop-2-uber/2.7.5-7.0/flink-shaded-hadoop-2-uber-2.7.5-7.0.jar)

连接Hive需要的组件：

flink-connector-hive
hive-exec

使用pyflink需要的组件

flink-python

这是我的lib目录下的所有jar (也可以参考Flink官方文档，https://ci.apache.org/projects/flink/flink-docs-master/dev/table/hive/scala_shell_hive.html）

配置Zeppelin + Flink

接下来是配置Zeppelin和Flink。首先解压缩Zeppelin包之后，cd到Zeppelin目录运行下面运行这个命令启动Zeppelin（注明：请使用Mac OS 或者 Linux系统，不要使用Windows）

bin/zeppelin-daemon.sh start

然后在浏览器里打开http://localhost:8080 就可以看到 Zeppelin页面了。

就下来就需要配置Flink Interpreter。在Zeppelin中可以使用3种不同的Flink集群模式

Local 模式

Remote 模式

Flink的Remote模式会连接一个已经创建好的Flink集群，一般是Flink standalone集群。除了配置FLINK_HOME 和 flink.execution.mode外，还需要配置flink.execution.remote.host和flink.execution.remote.port来指定JobManager的地址。

YARN 模式

Flink的Yarn模式会在Yarn集群中创建Flink Cluster。除了配置FLINK_HOME 和 flink.execution.mode还需要配置HADOOP_CONF_DIR，并且要确保Zeppelin这台机器可以访问你的hadoop集群。

验证Flink Interpreter

完成了上面的配置之后，可以运行下面的wordcount代码来验证Flink Interpreter是否能正常工作。

如上图所示，你可以看到WordCount的输出，以及右上角的Flink JOB链接，点击这个链接你可以看到Flink Web UI中关于这个WordCount Job的详细信息。

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

000X000 CSDN认证博客专家 CSDN认证企业博客

码龄7年

523: 原创

2万+: 周排名

4832: 总排名

82万+: 访问

: 等级

8585: 积分

1450: 粉丝

1205: 获赞

162: 评论

4977: 收藏

私信

关注

热门文章

分类专栏

最新评论

Docker pull镜像一直在Waiting无法下载，根本解决方法
White–Night: 如果你的梯子没问题，那应该是你没有将docker的仓库改到国外的，docker配置没改还是使用国内的仓库源，这样的话肯定waiting，这个我试过了，国内全军覆没，梯子ok的话国外源仓库正常拉取
Docker pull镜像一直在Waiting无法下载，根本解决方法
妙趣生花: 关键是我梯子一直挂着也提示Waiting 就贼无语
Flink 状态管理详解（超全收藏）
Randy_Sky: 你说了是算子，那么就算子状态而言，一个算子的并行度为3，那么相当于有有三个subtask中有这个算子的实例，而每个subtask只能访问到这个subtask本地的算子状态数据，所以各个线程之间的算子状态数据并不共享，每个subtask在处理数据时，访问和更新状态值的范围被限制在当前subtask中
Spark 解析嵌套的 JSON 文件
ha_lydms: 博主的文章一直都是我的学习指南，内容详实，让我从中获益良多，每篇博文都写的很好，你的博客内容深入浅出，期待你的下一次精彩分享
Flink 状态管理详解（超全收藏）
a160010: 如果一个算子的并行度是3 ，各个并行度之间的状态是共享的吗？

最新文章

2024

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。