yala说
码龄8年
关注
提问 私信
  • 博客:45,277
    问答:3,695
    动态:4
    48,976
    总访问量
  • 48
    原创
  • 32,298
    排名
  • 119
    粉丝
  • 0
    铁粉
IP属地以运营商信息为准,境内显示到省(区、市),境外显示到国家(地区)
IP 属地:上海市
  • 加入CSDN时间: 2017-04-19
博客简介:

天龙八部

博客描述:
当你回首往事,留下的都是记忆,而不是悔恨。
查看详细资料
  • 原力等级
    当前等级
    3
    当前总分
    208
    当月
    36
个人成就
  • 获得177次点赞
  • 内容获得5次评论
  • 获得268次收藏
创作历程
  • 4篇
    2025年
  • 8篇
    2024年
  • 1篇
    2022年
  • 1篇
    2021年
  • 6篇
    2020年
  • 29篇
    2019年
成就勋章
TA的专栏
  • k8s
    1篇
  • linux
    1篇
  • flink
    4篇
  • mysql
    1篇
  • spark
    12篇
  • java
    2篇
  • spark-sql学习
    3篇
  • hbase
    1篇
  • java不能多继承
    1篇
  • hive
    1篇
  • 大数据学习
    6篇
  • jvm
    2篇
  • redis日记
    1篇
  • hadoop之hdfs学习总结
    1篇
  • flume整理笔记
  • hadoop之yarn学习笔记
    1篇
  • kafka遇到的问题记录
    1篇
  • scala学习
    1篇
兴趣领域 设置
  • Python
    python
  • 大数据
    hadoophivestormsparketl
创作活动更多

超级创作者激励计划

万元现金补贴,高额收益分成,专属VIP内容创作者流量扶持,等你加入!

去参加
  • 最近
  • 文章
  • 代码仓
  • 资源
  • 问答
  • 帖子
  • 视频
  • 课程
  • 关注/订阅/互动
  • 收藏
搜TA的内容
搜索 取消

裸机器搭建k8s部署 1.28.10版本

问了搭建k8s集群踩了很多坑,问题主要出现在网络插件处,因此主要是master节点操作问题。重新走一下流程整理一下笔记。
原创
发布博客 2025.01.08 ·
693 阅读 ·
24 点赞 ·
0 评论 ·
21 收藏

Containerd单机使用教程

配置详情生成默认配置。
原创
发布博客 2025.01.08 ·
733 阅读 ·
27 点赞 ·
0 评论 ·
25 收藏

centos7升级系统内核

安装看k8s的网络插件一直失败,看到有提示可能是系统内核版本太低,抱着试试的心态进行内核升级。文章很多,操作流程都一样,但是很多部分地址下载不下来安装包。
原创
发布博客 2025.01.08 ·
119 阅读 ·
5 点赞 ·
0 评论 ·
1 收藏

虚拟机配置静态ip后出现两个ip问题

对比其他虚拟机,配置并无不同,一直也很奇怪。最后跟网上的配置对比时 发现是自己的文件配置修改错误 应该将BOOTPROTO="dhcp" 修改为static ,而实际修改成PROXY_METHOD="static" ,导致静态ip不生效。最后解决 修改vi /etc/sysconfig/network-scripts/ifcfg-ens33。通过ip addr 查看出现两个ip,一个是自己配置的静态ip,一个是动态分配的ip。将 BOOTPROTO="dhcp" #dhcp修改为static 后正常。
原创
发布博客 2025.01.07 ·
364 阅读 ·
2 点赞 ·
0 评论 ·
4 收藏

flink sink kafka的事务提交现象猜想

任务开启后数据可以源源不断的打印出来,感觉不到事务的存在。查询资料发现 kafka的隔离级别默认为读未提交,因此当事务数据没有提交时可以消费到数据,改为事务级别改为读已提交后,在样例1的checkpoint执行完前,消费不到数据。查看flink源码时 sink kafka有事务提交机制,查看源码发现是使用两阶段提交策略,而事务提交是checkpoint完成后才执行,那么如果checkpoint设置间隔时间比较长时,事务不提交,后端就消费不到数据呢?而观察实际现象为写入kafka的消费数据可以立马消费。
原创
发布博客 2024.12.12 ·
1168 阅读 ·
19 点赞 ·
0 评论 ·
7 收藏

flink-状态

状态是程序运行数据处理的中间数据或缓存数据。在flink中有状态、状态后端和checkpoint概念,三者之间的关系为:状态为数据,状态后端为状态的管理员,checkpoint是管理员将状态数据进行快照的手段。
原创
发布博客 2024.12.10 ·
1520 阅读 ·
16 点赞 ·
3 评论 ·
28 收藏

mysql的mvcc笔记

MVCC,全称Multi-Version Concurrency Control,即多版本并发控制,是一种并发控制的方法,;在并发读写数据库时,可以做到在读操作时不用阻塞写操作,写操作也不用阻塞读操作,提高了数据库并发读写的性能解决脏读、幻读、不可重复读等事务隔离问题,但是不能解决更新丢失问题。
原创
发布博客 2024.10.20 ·
704 阅读 ·
23 点赞 ·
0 评论 ·
31 收藏

开窗函数整理

大数据大部分是sqlboy,整理一下常用的开窗函数。
原创
发布博客 2024.08.12 ·
442 阅读 ·
5 点赞 ·
0 评论 ·
5 收藏

flink-触发器Trigger和移除器Evictor

继承Triger,重写抽象方法,案例.print();窗口长24小时,每十秒触发一次计算@Override//定义状态,记录该状态 触发器第一个元素进来时注册全部的触发器//第一次注册,右面全部跳过//注册触发器 间隔10s@Override//使用的事件时间,因此触发窗口的计算@Override@Override。
原创
发布博客 2024.06.27 ·
1315 阅读 ·
7 点赞 ·
0 评论 ·
21 收藏

flink 处理函数和流转换

flink提供8种不同的处理函数;窗口和流都可以使用1.ProcessFunction 是最基本的处理函数,基于DataStream直接调用process()时作为参数传入;2.KeydProcessFunction:是对流进行分区后的处理函数,基于KeyedStream调用process()时作为参数传入。只有该方法支持定时器功能(onTime);窗口函数,只有窗口可以使用。
原创
发布博客 2024.06.26 ·
775 阅读 ·
7 点赞 ·
0 评论 ·
21 收藏

flink的窗口

窗口是flink中重要的概念,为了方便高效的处理无界流,将数据切成有限的数据块进行处理;
原创
发布博客 2024.06.26 ·
1657 阅读 ·
26 点赞 ·
0 评论 ·
23 收藏

虚拟机器centos7无法识别yum 命令异常处理笔记

添加后执行yum 命令正常设置linux本地的客户端DNS的配置文件。DNS可以实现域名和IP的互相解析,而我本地安装虚拟后该文件为空。
原创
发布博客 2024.02.22 ·
832 阅读 ·
5 点赞 ·
0 评论 ·
5 收藏

部署k8s踩坑记录

k8s部署后冲节点一直是norready
原创
发布博客 2022.04.05 ·
1620 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

compareto 排序异常记录

记录一次 compareto使用异常java.lang.IllegalArgumentException: Comparison method violates its general contract!源代码 如下 刚开始执行运行都没有任何问题 上线后也运行了一段时间,知道有一次数据量比较大 出现这个异常,查看日志问题错误发生在这个排序比较的地方@Overridepublic int compare(Integer o1, Integer o2) { return o1.intVa..
原创
发布博客 2021.05.09 ·
632 阅读 ·
2 点赞 ·
0 评论 ·
2 收藏

dateSet 、rdd 和dateframe 区别

三种数据结构出现的版本顺序RDD (Spark1.0) -->Dataframe(Spark1.3) -->Dataset(Spark1.6)RDDrdd的五大特性 这个用了很多,但是当突然被问到五大特性时,竟然一时卡壳,只记得弹性可分区和容错 ,而血统、依赖和数据本地化并没有归并到特性中,重新查看资料后,发现自己错在把rdd当成一种数据集合, 可分区列表:可以创建指定分区数目,可以生成新的rdd来改变分区数 作用在分区的函数:rdd的计算都是以分区为单位 依赖关系...
原创
发布博客 2020.09.15 ·
794 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

spark-sql cli模式下的优化经验

在spark-sql cli模式下只能是纯sql ,这个对于执行过程中的一些操作基本没有操作的可能,因此当出现执行速度很慢时优化难以入手
原创
发布博客 2020.05.26 ·
680 阅读 ·
0 点赞 ·
0 评论 ·
2 收藏

Spark SQL 之 Join 实现

在这篇文章中:SparkSQL总体流程介绍Join基本要素Join基本实现流程sort merge join实现broadcast join实现hash join实现inner joinleft outer joinright outer joinfull outer joinleft semi joinleft anti join总结文章写...
转载
发布博客 2020.02.29 ·
184 阅读 ·
0 点赞 ·
0 评论 ·
1 收藏

spark-sql运行脚本报错 tasks bigger than bigger than spark.driver.maxResult

spark-sql执行脚本,导出数据的脚本爆出如下异常;Caused by: org.apache.spark.SparkException:Job aborted due to stage failure: Total size of serializedresults of 1212tasks (10300 MB) is bigger thanspark.driver.maxResul...
原创
发布博客 2020.02.29 ·
803 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

spark-sql 堆外内存溢出

运行执行spark-sql 脚本文件,爆出对堆外内存溢出错误如下图,先区分发生异常是executor端还是driver端,我遇到的问题是driver端,因为最后数据导出生成文件,数据会在driver端收集结果集。调节方式有两种,第一种正大driver-memory值,堆外内存计算公式默认是max(0.1*driver-memory ,384M),(executory的的对外内存计算公式也是一样...
原创
发布博客 2020.02.29 ·
1220 阅读 ·
0 点赞 ·
2 评论 ·
4 收藏

spark1.5.1执行spark-sql client执行insert into 报错 解决

原先语句是在spark2.1上执行的sql,现在放到spark1.5上执行执行失败;现象描述:如果没有用insert 直接执行select 语句,是不会报错,执行insert 但是去除exists的子查询,也是不会报错。所以感觉很奇怪,然后将not exists用left anti join 代替 发现spark1.5也不支持。各种尝试后最后在inert into 后面加上table 关键字...
原创
发布博客 2020.01.07 ·
4051 阅读 ·
0 点赞 ·
0 评论 ·
2 收藏
加载更多