
kafka开发/集群运维
文章平均质量分 91
kafka企业开发应用,kafka基础语法,kafka集群日常运维,kafak集群运维,优化。
涤生大数据
在职阿里,美团,京东,字节大数据技术专家,擅长大数据开发,集群架构/运维,爱好python数据分析/爬虫,
加 v: dsflink 可免费转行评估,职业规划,校招规划,大数据进阶指导,简历把脉
欢迎一起交流
展开
-
涤生大数据教学集群的首次运维现场复现
基于以上wiki服务的报错,一开始怀疑是网络的问题,首先查看了阿里云的网络监控,再次查看了我们的vpn服务监控(因为我们在集群安全防护上,是将所有的主机服务都隐藏在阿里云内网的,学员的对教学环境资源的访问都是需要通过VPN认证登录)还有其他内部服务的访问也都是没有问题的,这足以说明网络上是健康的。),具体查看磁盘的存储文件,发现其他的日志文件也占据不小的存储空间,(简直就是看到了救命稻草),删除此部分文件,应该可以恢复磁盘的正常读写,进而将整体服务拉起来,后面也就迎刃而解了。所有服务恢复正常运行。原创 2023-07-20 09:15:00 · 570 阅读 · 1 评论 -
CDH启用kerberos 高可用运维实战
在前的文章中介绍过《CDH集成的kerberos迁移实战》,由此也考虑到kerberos单节点可能引发的线上事故,所有考虑到把线上kerberos服务启用高可用。原创 2022-11-25 06:30:00 · 1390 阅读 · 1 评论