程序猿的野生香蕉
码龄5年
关注
提问 私信
  • 博客:43,713
    43,713
    总访问量
  • 43
    原创
  • 748,991
    排名
  • 9
    粉丝
  • 0
    铁粉

个人简介:在运维道路上一路狂飙的老司机,在这里你能看到云原生,k8s等等

IP属地以运营商信息为准,境内显示到省(区、市),境外显示到国家(地区)
IP 属地:福建省
  • 加入CSDN时间: 2020-03-06
博客简介:

dgsfor的博客

查看详细资料
个人成就
  • 获得9次点赞
  • 内容获得3次评论
  • 获得66次收藏
  • 代码片获得469次分享
创作历程
  • 4篇
    2021年
  • 21篇
    2020年
  • 18篇
    2016年
成就勋章
TA的专栏
  • 在gke搭建一套生产环境
    付费
兴趣领域 设置
  • 移动开发
    flutter
  • 运维
    容器jenkinsdevops自动化kubernetes系统架构运维开发
  • 服务器
    linuxcentos
创作活动更多

如何做好一份技术文档?

无论你是技术大神还是初涉此领域的新手,都欢迎分享你的宝贵经验、独到见解与创新方法,为技术传播之路点亮明灯!

344人参与 去创作
  • 最近
  • 文章
  • 代码仓
  • 资源
  • 问答
  • 帖子
  • 视频
  • 课程
  • 关注/订阅/互动
  • 收藏
搜TA的内容
搜索 取消

从日常巡检出发,如何建设稳定性运营/报告平台

背景首先说一些日常工作场景:你的群里是否经常会发送一些巡检报告,比如qps峰值统计,cpu利用率,机器使用数量统计等等你的领导是否需要你每周发送一次公司业务层级的运行报告,包括上周有没有故障,上周所有业务的qps峰值是多少,周期内的一些业务变更或者运营活动等。所以你可能会看到类似这样的一些图:初步思考基于上述的背景,我们常规的实现方式有以下几种:日常的巡检报告,我们可能会用一个脚本定期的获取数据,然后发送到企业微信机器人、邮箱、钉钉等周、月巡检报告运营报告这些,我们可能需要手动创
原创
发布博客 2021.07.14 ·
692 阅读 ·
0 点赞 ·
1 评论 ·
2 收藏

定制化ingress 403页面

背景默认的ingress controller提供的403 error页面太丑了,想要定制化一下实现1.增加一个configmap,定义403页面2.挂载到ingress-controller的pod里3.对单个ingress对象增加annotation注解开始吧增加一个configmapmeitu403.html: | <head><meta charset="UTF-8"></head> <html> <h1
原创
发布博客 2021.03.10 ·
1018 阅读 ·
0 点赞 ·
0 评论 ·
1 收藏

端口被短连接耗尽了怎么办

背景最近发现业务POD使用短连接过程中,端口被耗尽,一系列操作。方案扩大端口数量降低单pod配置,横向扩容pod个数改成长链接调整内核参数扩大端口数量pod新增内核参数net.ipv4.ip_local_port_range = 1024 65535横向扩容如果上述修改端口限制无法解决你的问题,那么能快速解决问题的方法就是降低你单pod规格,使得pod个数增加,分担端口压力。修改成长链接改这个,也需要你业务支持,编程语言有比较好的支持。调整内核参数这两个参数配合使用,r
原创
发布博客 2021.03.10 ·
963 阅读 ·
0 点赞 ·
0 评论 ·
1 收藏

go get国内加速

背景go开发过程中,国内下载依赖包太慢了,怎么办?配置开启go moduleexport GO111MODULE=on配置代理export GOPROXY=https://goproxy.io下载,可以试用go get 体验极速额外说一句有很多都是配置阿里云的export GOPROXY=https://mirrors.aliyun.com/goproxy/,不过我发现很多包都找不到,所以干脆不用了。全局配置你可以配置到/etc/profile或者个人用户下~/.ba
原创
发布博客 2021.03.10 ·
740 阅读 ·
0 点赞 ·
0 评论 ·
1 收藏

《将博客搬至CSDN》

本人已经将博客迁移到csdn,环境大家来csdn找我!csdn名称:程序猿的野生香蕉
原创
发布博客 2020.11.16 ·
105 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

https证书cer转pem或者crt

背景在对接各个cdn厂商的过程中,会遇到上传https证书的需求,不过不同的厂商导入https的姿势或者格式是不同的,证书签发商一般给的都是cer+key,所以需要我们做一下格式转换等操作。cer转pem$ openssl x509 -inform PEM -in xx-xx-com.cer -out xx-xx-com.p...
原创
发布博客 2020.11.16 ·
5612 阅读 ·
2 点赞 ·
0 评论 ·
6 收藏

(官方版)使用helm3在gke集群中安装ingress-nginx

说明前两篇文章已经讲解过nginx-ingress,nginx-ingress是由nginx官方推出的,今天讲解一下k8s社区推出的ingress-nginx。另外gke上基础的东西我就不讲了,类似节点池的创建,在之前的文章都已经写过了,不太懂的可以翻看一下。前置注意k8s集群版本要求>=1.16.0-0,所以如果没达到要...
原创
发布博客 2020.11.12 ·
477 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

(deployment篇)使用helm3在gke中安装ingress-controller

背景上一篇文章已经通过daemonset的方式安装部署了ingress-controller,这篇文章我们主要通过deployment方式来部署,其实基本上差不多,就一些小点需要修改下罢了。如果你没有看过上一篇文章,请先看上一篇的内容。步骤创建gke ingress 节点池下载最新的helm charts修改配置文件...
原创
发布博客 2020.11.12 ·
322 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

(daemonset篇)使用helm3在gke中安装ingress-controller

背景我们的业务目前在gke上是使用的自带的ingress服务,直接对接他们的loadbalancer服务,上几篇文章写的是安装prometheus,发现获取不到代理层的一些数据,所以想直接自己撸ingress-controller来实现。备注:gke上的stackdriver虽然可以看到比较多的数据,但是关于loadbalance...
原创
发布博客 2020.11.11 ·
490 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

使用prometheusrules自定义创建告警规则

介绍首先这篇文章是跟着上一篇helm 部署prometheus-operator来的,部署完成之后,我们就需要自定义一些配置。这篇文章主要讲解如何自定义告警规则,如何让prometheus发现他。步骤添加prometheusrules规则验证名词解释prometheusrules,也是安装好prometheus-o...
原创
发布博客 2020.11.09 ·
2436 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

使用ServiceMonitor自定义暴露指标

介绍首先这篇文章是跟着上一篇helm 部署prometheus-operator来的,部署完成之后,我们就需要自定义一些配置。这篇文章主要讲解如何自定义服务发现,当我们有一个服务想要暴露数据给prometheus,我怎么操作。步骤部署你的服务,并暴露数据添加svc添加servicemonitor规则验证拓展名...
原创
发布博客 2020.11.09 ·
7777 阅读 ·
1 点赞 ·
0 评论 ·
10 收藏

使用helm3在gke上安装prometheus-operator

简介本文主要讲解如何使用helm3在gke上安装prometheus-operator,包含持久化存储的使用。今天会先最简单安装一下prometheus-operator,然后再一步一步优化,最终我们使用自定义Chart文件保存为私有的安装包。前提安装并会使用helm3步骤安装helm3最简安装prometh...
原创
发布博客 2020.11.06 ·
932 阅读 ·
1 点赞 ·
0 评论 ·
0 收藏

helm仓库chartmuseum的部署

了解chartmuseum用过helm的都知道,chartmuseum作为helm重要的仓库,掌握他的私有部署是必不可少的。官方文档:跳转部署方式chartmuseum的部署方式有两种,从官方首页就能看出来:一种是二进制,一种是docker。二进制部署方式1.下载二进制文件curl -LO https://s3.am...
原创
发布博客 2020.10.20 ·
2040 阅读 ·
1 点赞 ·
1 评论 ·
5 收藏

用java简单实现一个prometheus exporter

介绍塔罗斯(Talus)塔罗斯(希腊语:Ταλως;英语:Talos / Talus)是希腊神话中的机械巨人(Automaton)。该名义为“砍伐”或“太阳”。塔罗斯的身世有三种版本。按赫西奥德(Hesiod)的说法,宙斯曾创造了四代人类:黄金、白银、青铜、黑铁。功能后期主要提供给thanos运维数据,提供promethe...
原创
发布博客 2020.09.23 ·
3496 阅读 ·
0 点赞 ·
0 评论 ·
8 收藏

如何使用prometheus监控nginx

[toc]需求场景使用prometheus监控nginx,图表展示使用grafana。分析nginx我们使用tengine(https://github.com/alibaba/tengine)nginx prometheus模块使用nginx-module-vts(https://github.com/vozlt/n...
原创
发布博客 2020.09.18 ·
1259 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

k8s亲和和反亲和相关

背景最近在测试亲和和反亲和,发现很多知识都遗忘了,准备重新捡起来看看。Pod和Node从pod出发,可以分成亲和性和反亲和性,分别对应podAffinity和podAntiAffinity。从node出发,也可以分成亲和性和反亲和性,分别对应nodeAffinity和nodeAntiAffinity。从操作指令来讲,可以...
原创
发布博客 2020.09.17 ·
311 阅读 ·
0 点赞 ·
0 评论 ·
1 收藏

不使用gcloud认证gke集群

背景正常我们都是通过gcloud切换集群,然后才能正常使用kubectl,这篇文章主要教你如何”不使用”gcloud来进行gke集群的认证。这里的不使用,意思是只要使用一次即可。准备首先需要一台机器,已经装好gcloud并认证,初始化可参考官方文档:点击我开始1.创建环境变量替换下面命令中的GKE_CLUSTER_NAME...
原创
发布博客 2020.07.23 ·
310 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

云运维-简单认识各个云常用云服务

说明再多的讲解不如后面的实战课程,概念性的东西本身有点枯燥无味,这篇文章旨在让大家对我们使用的云服务有一个大概的了解,后续补个ppt在大家了解华为云之后,其实这篇文章相对来说就没这么重要的,我就简单列举下常用的,另外说几个其他云独有的服务。华为云/阿里云下面这些都是最基本的服务,搭建一套完整的可用生产环境就需要这些...
原创
发布博客 2020.06.23 ·
1463 阅读 ·
0 点赞 ·
0 评论 ·
4 收藏

云运维-开篇随便聊聊自己

背景写这个系列的目的:内部建设,sre组内之间分工明确,不过知识互通和共享目前暂时比较欠缺,通过这个把自己的沉淀分享出去。个人总结,其实早就想要总结一下工作的这几年,不过一直没有动手,趁着这个机会,搞一把。查漏补缺,每次写文档和总结的时候都是一个非常好的学习机会。随便说点回忆过去17年7月毕业,然后进入了第一家公司...
原创
发布博客 2020.06.22 ·
114 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

SRE在多云环境下的生存之道

持续更新中……简介名称:SRE在多云环境下的生存之道简介:主要总结一下自己在云运维道路上的点点滴滴、踩的坑等。第一让新人快速认识各种云,第二让坑不再重演。地址:微信公众号程序猿的野生香蕉开篇云运维–开篇基础篇:云运维–通俗讲解各个云常用云服务进阶篇:云运维–如何在华为云快速部署一套可用的生产环境云运维–如何在...
原创
发布博客 2020.06.22 ·
382 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏
加载更多