大数据
学会闭嘴的Ting
学会闭嘴
展开
-
初学者——用Flink消费kafka数据
一、Flink基本了解Apache Flink其核心是用Java和Scala编写的分布式流数据流引擎。Flink以数据并行和流水线方式执行任意流数据程序,Flink的流水线运行时系统可以执行批处理和流处理程序。二、环境说明scala、 flink 、 kafka、 hadoop三、主要代码1. 初始化flink流处理的运行环境//初始化flink流处理的运行环境StreamExecutionEnvironment env = StreamExecutionEnvironment.getExec原创 2021-09-02 17:36:58 · 8759 阅读 · 4 评论 -
RDD初级编程——Hadoop上传文章到集群
在搭建了Hadoop集群后,可以用shell命令进行文件的新建和上传,自己在上传的时候遇到了问题如下:put: File /test/test2.txt._COPYING_ could only be replicated to 0 nodes instead of minReplication (=1). There are 2 datanode(s) running and 2 node(s) are excluded in this operation.主要解决方案:在namenode和d原创 2021-06-09 15:34:24 · 736 阅读 · 0 评论
分享