陆师傅说
码龄14年
关注
提问 私信
  • 博客:64,344
    社区:84
    动态:13
    64,441
    总访问量
  • 22
    原创
  • 1,411,841
    排名
  • 35
    粉丝
  • 0
    铁粉
IP属地以运营商信息为准,境内显示到省(区、市),境外显示到国家(地区)
IP 属地:山东省
  • 目前就职: 浪潮集团
  • 加入CSDN时间: 2010-12-01
博客简介:

陆继森的技术专栏

博客描述:
结合项目经验,持续更新大数据项目落地实战案例,关注我,享更多
查看详细资料
个人成就
  • 获得28次点赞
  • 内容获得17次评论
  • 获得96次收藏
  • 代码片获得160次分享
创作历程
  • 2篇
    2023年
  • 1篇
    2021年
  • 16篇
    2020年
  • 1篇
    2019年
  • 1篇
    2018年
  • 2篇
    2017年
成就勋章
TA的专栏
  • 企业级大数据应用实战(持续更新...)
    付费
    1篇
  • elasticsearch
  • Flink
    15篇
  • starrocks
    1篇
  • HBase
    3篇
  • Hdfs
  • Ambari
  • Spark
    2篇
  • Hive
  • Kerberos
  • 数据库
  • HUE
    2篇
  • oozie
  • storm
兴趣领域 设置
  • 大数据
    hadoophivestormsparkflinketl
  • 人工智能
    数据分析
创作活动更多

超级创作者激励计划

万元现金补贴,高额收益分成,专属VIP内容创作者流量扶持,等你加入!

去参加
  • 最近
  • 文章
  • 代码仓
  • 资源
  • 问答
  • 帖子
  • 视频
  • 课程
  • 关注/订阅/互动
  • 收藏
搜TA的内容
搜索 取消

FlinkCDC实现主数据与各业务系统数据的一致性(瀚高、TIDB)

FlinkCDC实现业务系统主数据对应字段,用主数据系统主数据字段实时覆盖
原创
发布博客 2023.11.22 ·
1587 阅读 ·
1 点赞 ·
4 评论 ·
0 收藏

starrocks2.5.4 +ARM架构+Kylin v10 源码编译报错(be报错):‘FLAGS_log_split_method’ was not declared in this scope

3、logconfig.cpp文件引入#include (本身已经引入的不用再次引入),然后找个starrocks的已安装的第三方库,路径一般为:/opt/starrocks/starrocks-2.5.4/thirdparty/installed/include/glog,这是编译好的,直接修改这个也可以,或者直接修改第三方库的源码中的glog/logging.h文件,重新编译三方库都可以;
原创
发布博客 2023.04.26 ·
340 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

实战:Flink1.12异步IO访问外部数据-Mysql

微信公众号:大数据开发运维架构关注可了解更多大数据相关的资讯。问题或建议,请公众号留言;如果您觉得“大数据开发运维架构”对你有帮助,欢迎转发朋友圈从微信公众号拷贝过来,格式有些错乱,建议直接去公众号阅读本文结合官网和网络资料,讲解 Flink 用于访问外部数据存储的异步 I/O API。对于不熟悉异步或者事件驱动编程的用户,建议先储备一些关于 Future 和事件驱动编程的知识。Flink异步IO官方文档地址:https://ci.apache.org/projects/flin.
原创
发布博客 2021.08.19 ·
928 阅读 ·
2 点赞 ·
0 评论 ·
3 收藏

Flink1.10进阶:Window的AllowedLateness介绍及与Watermark的综合实战详解

微信公众号:大数据开发运维架构关注可了解更多大数据相关的资讯。问题或建议,请公众号留言;如果您觉得“大数据开发运维架构”对你有帮助,欢迎转发朋友圈从微信公众号拷贝过来,格式有些错乱,建议直接去公众号阅读总结一下,这里结合了Watermark和AllowedLateness机制,进行了原理介绍和代码实战,最后代码测试中,输入了11条测试数据,并对每条输入数据的触发原理进行了详细的讲解,详细说明了每条数据的输入哪个窗口,如何触发窗口计算的,以及各条数据发送完成后,当前的watermark是多少,
原创
发布博客 2020.05.18 ·
514 阅读 ·
0 点赞 ·
0 评论 ·
1 收藏

HBase2.x精通:结合源码讲解Region的三种Spilt策略

微信公众号:大数据开发运维架构关注可了解更多大数据相关的资讯。问题或建议,请公众号留言;如果您觉得“大数据开发运维架构”对你有帮助,欢迎转发朋友圈从微信公众号拷贝过来,格式有些错乱,建议直接去公众号阅读一、概述 最近在工作中接触到split,于是查看了这块的源代码,先看到了split的策略,今天就说说这个吧;这里我是基于HDP版本的Hadoop集群,对应的HBase的版本为2.2.1,后续的分析都是基于该版本的源码做的分析,HBase-2.x支持7种Region自动拆...
原创
发布博客 2020.05.13 ·
725 阅读 ·
0 点赞 ·
0 评论 ·
1 收藏

Spark2.x源码剖析系列文章(共21篇|经典必读)

微信公众号:大数据开发运维架构关注可了解更多大数据相关的资讯。问题或建议,请公众号留言;如果您觉得“大数据开发运维架构”对你有帮助,欢迎转发朋友圈从微信公众号拷贝过来,格式有些错乱,建议直接去公众号阅读原文链接:https://mp.weixin.qq.com/s?__biz=MzIxNjE2NjU1OQ==&mid=2247484516&idx=1&sn=67d8e46ab8bb023edb88a13d2662fd7f&chksm=978c7d94a0f
原创
发布博客 2020.05.12 ·
494 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

Flink1.10入门:TableAPI自定义UDF实现WordCount

微信公众号:大数据开发运维架构关注可了解更多大数据相关的资讯。问题或建议,请公众号留言;如果您觉得“大数据开发运维架构”对你有帮助,欢迎转发朋友圈从微信公众号拷贝过来,格式有些错乱,建议直接去公众号阅读一、概述本篇文章作为Flink的TableAPI&SQL的入门案例,在TableAPI自定义UDF函数,继承了TableFunction()函数来实现WordCo...
原创
发布博客 2020.05.08 ·
615 阅读 ·
0 点赞 ·
0 评论 ·
1 收藏

Flink1.10入门:自定义Redis的Sink函数

微信公众号:大数据开发运维架构关注可了解更多大数据相关的资讯。问题或建议,请公众号留言;如果您觉得“大数据开发运维架构”对你有帮助,欢迎转发朋友圈从微信公众号拷贝过来,格式有些错乱,建议直接去公众号阅读一、概述这篇文章需要完成的是将实时数据写到Redis,我这里自定义了Ridis对应的Sink函数,为了方便直接从socket端接收数据,operator处理后,直接写入r...
原创
发布博客 2020.05.06 ·
1074 阅读 ·
1 点赞 ·
0 评论 ·
0 收藏

Flink入门:StreamingFileSink相关特性及代码实战

微信公众号:大数据开发运维架构关注可了解更多大数据相关的资讯。问题或建议,请公众号留言;如果您觉得“大数据开发运维架构”对你有帮助,欢迎转发朋友圈从微信公众号拷贝过来,格式有些错乱,建议直接去公众号阅读一、概述 Flink流式计算的核心概念,就是将数据从Source输入流一个个传递给Operator进行链式处理,最后交给Sink输出流的过程。本篇文章主要讲解Sink端比较...
转载
发布博客 2020.04.27 ·
5145 阅读 ·
1 点赞 ·
0 评论 ·
12 收藏

Flink实战:自定义KafkaDeserializationSchema(Java/Scala)

微信公众号:大数据开发运维架构关注可了解更多大数据相关的资讯。问题或建议,请公众号留言;如果您觉得“大数据开发运维架构”对你有帮助,欢迎转发朋友圈从微信公众号拷贝过来,格式有些错乱,建议直接去公众号阅读 kafka中的数据通常是键值对的,所以我们这里自定义反序列化类从kafka中消费键值对的消息,为方便大家学习,这里我实现了Java/Scala两个版本,由于比较简单这里直接上...
原创
发布博客 2020.04.25 ·
10210 阅读 ·
4 点赞 ·
8 评论 ·
15 收藏

HBase1.x运维:Multiple regions have the same endkey报错处理

微信公众号:大数据开发运维架构关注可了解更多大数据相关的资讯。问题或建议,请公众号留言;如果您觉得“大数据开发运维架构”对你有帮助,欢迎转发朋友圈从微信公众号拷贝过来,格式有些错乱,建议直接去公众号阅读软件版本:hadoop2.7.3hbase1.2.5zookeeper3.4.61.问题描述:生产HBase集群由于批量导入20亿数据...
原创
发布博客 2020.04.21 ·
1549 阅读 ·
0 点赞 ·
0 评论 ·
4 收藏

Flink1.10实战:自定义聚合函数AggregateFunction

微信公众号:大数据开发运维架构关注可了解更多大数据相关的资讯。问题或建议,请公众号留言;如果您觉得“大数据开发运维架构”对你有帮助,欢迎转发朋友圈从微信公众号拷贝过来,格式有些错乱,建议直接去公众号阅读一,概述 Flink 的AggregateFunction是一个基于中间计算结果状态进行增量计算的函数。由于是迭代计算方式,所以,在窗口处理过程中,不用缓存整个窗口的数据,所...
原创
发布博客 2020.04.16 ·
12136 阅读 ·
4 点赞 ·
0 评论 ·
22 收藏

Flink1.10入门:Checkpoint机制介绍

微信公众号:大数据开发运维架构关注可了解更多大数据相关的资讯。问题或建议,请公众号留言;如果您觉得“大数据开发运维架构”对你有帮助,欢迎转发朋友圈从微信公众号拷贝过来,格式有些错乱,建议直接去公众号阅读一、Checkpoint概念上篇文章我们已经讲了Flink的状态管理,对于这些状态如何保存,我们一起学习一下Flink的Checkpoint机制。Flink本身为了保证其...
原创
发布博客 2020.04.14 ·
710 阅读 ·
0 点赞 ·
0 评论 ·
1 收藏

Flink1.10入门:状态管理介绍

微信公众号:大数据开发运维架构关注可了解更多大数据相关的资讯。问题或建议,请公众号留言;如果您觉得“大数据开发运维架构”对你有帮助,欢迎转发朋友圈从微信公众号拷贝过来,格式有些错乱,建议直接去公众号阅读一、概述我们先来看Flink官方文档的第一句话:Apache Flink is a framework and distributed processing ...
原创
发布博客 2020.04.14 ·
336 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

Flink1.10进阶:ProcessFunction介绍及KeyedProcessFunction实例

微信公众号:大数据开发运维架构关注可了解更多大数据相关的资讯。问题或建议,请公众号留言;如果您觉得“大数据开发运维架构”对你有帮助,欢迎转发朋友圈从微信公众号拷贝过来,格式有些错乱,建议直接去公众号阅读一、ProcessFunction介绍从之前的文章我们知道,转换算子是无法访问事件的时间戳信息和水位线信息的。而这在一些应用场景下,极为重要。例如我们常用的MapFunc...
原创
发布博客 2020.04.14 ·
4587 阅读 ·
9 点赞 ·
1 评论 ·
12 收藏

Flink1.10实战:两种分流器Spilt-Select和Side-Outputs

一、概述 Flink两种分流器Split和Side-Outputs,新版本中Split分流接口已经被置为“deprecated”,Split只可以进行一级分流,不能进行二级分流,Flink新版本推荐使用Side-Outputs分流器,它支持多级分流。二、分流器使用 我这里有一份演示数据,里面是人的一些籍贯信息,每条数据有5个字段,分别代表:姓名、所在省份、所...
原创
发布博客 2020.04.14 ·
904 阅读 ·
2 点赞 ·
0 评论 ·
4 收藏

Flink1.10入门:Watermark机制及实例讲解

微信公众号:大数据开发运维架构关注可了解更多大数据相关的资讯。问题或建议,请公众号留言;如果您觉得“大数据开发运维架构”对你有帮助,欢迎转发朋友圈一、Watermark简介 Watermark是一种衡量Event Time进展的机制,它是数据本身的一个隐藏属性。通常基于Event Time的数据,自身都包含一个timestamp.watermark是用于处理乱序...
原创
发布博客 2020.04.12 ·
886 阅读 ·
0 点赞 ·
0 评论 ·
7 收藏

Flink1.10入门:时间机制简介

微信公众号:大数据开发运维架构关注可了解更多大数据相关的资讯。问题或建议,请公众号留言;如果您觉得“大数据开发运维架构”对你有帮助,欢迎转发朋友圈一、概述上篇文章介绍了Window窗口机制的相关知识,这里我们介绍下Flink的另外一个核心概念“Event Time机制”,本篇文章只介绍相关概念不讲实战,实战会结合Window窗口机制一起讲解。二、Flink中的三...
原创
发布博客 2020.04.12 ·
476 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

Flink1.10入门:Window窗口机制简介

微信公众号:大数据开发运维架构关注可了解更多大数据相关的资讯。问题或建议,请公众号留言;如果您觉得“大数据开发运维架构”对你有帮助,欢迎转发朋友圈一、Window概念上面是Flink1.10的官方文档的一句话,翻译了一下大体意思是:Window是处理无限数据流的核心,Windows将流分割为有限大小的“buckets”,我们可以在上面应用计算。...
原创
发布博客 2020.04.12 ·
705 阅读 ·
1 点赞 ·
0 评论 ·
0 收藏
加载更多