大数据
文章平均质量分 83
整理和收集各类大数据技术
IT瓜哥-杨得朝
多年JavaWeb开发,K8S,大数据开发10+年经验,具有多个大型项目实战经验。擅长分布式系统,微服务系统架构与设计,尤其对海量日志收集和存储非常熟悉,熟悉大数据云计算相关技术,参与过docker,mesos,marathon,elasticsearch、rbbitMq,springCloud,hadoop,spark,hibv,hase等相关技术系统开发和架构设计,此外对分布式对象存储ceph等相关数据有所涉猎。
展开
-
Flink部署安装及其WorldCount执行
Flink启动及其WorldCount执行大家好,是瓜哥,最近几年,大数据处理组件Flink非常火,作为一个从事多年java的老程序员,也得跟上时代的技步伐,不然迟早就会被这个技术千变万化的时代抛弃。Flink 是一个针对流数据和批数据的分布式处理引擎,代码主要是由 Java 实现,部分代码是 Scala。它可以处理有界的批量数据集、也可以处理无界的实时数据集。对 Flink 而言,其所要处理的主要场景就是流数据,批数据只是流数据的一个极限特例而已,所以 Flink 也是一款真正的流批统一的计...原创 2021-11-09 10:05:14 · 1936 阅读 · 0 评论 -
Flink流处理StreamExecutionEnvironment用法
大家好,我是瓜哥,今天进行了Flink相关内容的总结和学习。Flink可以处理实时流式数据处理。具体的资料文档可以登录flink官方文档直接进行在线学习。flink官方文档直接看官方文档对flink的一个架构图:Apache Flink 功能强大,支持开发和运行多种不同种类的应用程序。它的主要特性包括:批流一体化、精密的状态管理、事件时间支持以及精确一次的状态一致性保障等。Flink 不仅可以运行在包括 YARN、 Mesos、Kubernetes 在内的多种资源管理框架上,还支持在裸机集群原创 2021-11-05 10:59:30 · 9258 阅读 · 0 评论