docker-k8s容器技术
运维打怪晋级之路
2011毕业以后就从事运维工作的,从一名职场新手通过自己的学习和工作中的总结慢慢提升自己的专业技能,目前在一家互联网公司做运维架构师,主要负责公司阿里云的服务器和服务的运维工作,之前在亚信科技从事过业务维护工程师、自动化运维工程师、报表稽核开发工程师,2016年转为报表开发工程师,2018年跳槽到一家互联网公司做高级运维工程师,主要负责公司系统的运维架构以及系统安全,目前我在一家国企任职高级运维工程师。我在工作中有耐心,抗压力、爱折腾,喜欢研究自动化工具,喜欢写一些博客技术分享。擅长linux系统、shell脚本、python脚本、ELK系统、JAVA系统调优、docker、k8s等。
展开
-
K8S集群之-ETCD集群监控
ETCD集群监控原创 2023-03-16 14:20:26 · 1402 阅读 · 0 评论 -
K8S集群宿主机CPU过高处理
K8S集群宿主机CPU过高处理今天告警收到一个K8S集群的node节点CPU使用率过高告警,经过排查是一个POD没有限制CPU使用导致的,在容器云环境中应用服务最好做CPU、MEM的限制,不然有异常的服务会导致不可想象后果。处理过程查询服务的PID通过top命令我们可以看到确实是CPU使用过高,也能查到对应的PID[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-hwpRSsMj-1640770263586)(https://www.showdoc.com..原创 2021-12-29 17:32:22 · 3949 阅读 · 7 评论 -
如何在k8s的pod中查询top显示真实信息
利用LXCFS增强容器隔离性和资源可见性Linuxs利用Cgroup实现了对容器的资源限制,但在容器内部依然缺省挂载了宿主机上的procfs的/proc目录,其包含如:meminfo, cpuinfo,stat, uptime等资源信息。一些监控工具如free/top或遗留应用还依赖上述文件内容获取资源配置和使用情况。当它们在容器中运行时,就会把宿主机的资源状态读取出来,引起错误和不便。安装LXCFS[root@localhost]# wget https://copr-be.cloud.f.原创 2021-12-21 17:23:10 · 2551 阅读 · 0 评论 -
K8S容器云平台查询容器TOP真实使用情况工具之Topic
K8S容器云平台查询容器TOP真实使用情况工具之Topic1、说明容器通过 cgroups和 namespace 实现了资源的轻量级隔离和限制,但容器中的/proc文件实际上是宿主机的,因此在执行 top命令查看容器运行信息时,部分指标显示不正确,例如启动时间、用户数、平均负载、cpu 使用率、内存使用率,那么如何在容器中查询top的使用情况呢?开源的二进制命令topic完美解决此问题。...原创 2021-09-26 16:06:56 · 1513 阅读 · 0 评论 -
K8S指标样图解释说明
K8S样图解释说明K8S监控指标中标签name解释K8S使用A记录域名原创 2021-08-19 17:23:43 · 240 阅读 · 0 评论 -
01 - Go 语言环境安装
01 - Go 语言环境安装go语言学习第一天1、下载 windows 安装包安装完成后验证是否安装成功使用 cmd 进入 windows 的终端输入 go env2、修改 go 的环境代理配置由于默认 go 环境使用的下载包的地址是国外的地址,我们国内下载不方便,因此设置代理很有必要。国内比较好的代理如下:七牛云赞助支持的export GOPROXY=https://goproxy.cn阿里云export GOPROXY=https://mirrors.aliy.原创 2021-08-04 15:19:27 · 125 阅读 · 2 评论 -
使用prometheus监控zookeeper集群
使用prometheus监控zookeeper集群1、踩过的坑1.1、部署docker监控其中一个节点[root@gtcq-gtmed-wm-public-02 local]# docker run -it -p 9141:9141 --name=zookeeper_exporter_m -d -v /etc/localtime:/etc/localtime carlpett/zookeeper_exporter -zookeeper 10.153.23.2:2181依次部署其它节点后发现.原创 2021-07-15 19:17:53 · 4719 阅读 · 4 评论 -
Grafana可视化工具-之Heatmap(热图)
Grafana可视化工具-之Heatmap(热图)Heatmap是Grafana的原生插件,Heatmap(热图)您可以查看一段时间内的直方图。要完全理解和使用此面板,您需要了解什么是直方图以及如何创建它们。阅读以下内容以快速了解术语直方图。什么是直方图?直方图是用于表示数值分布的图形,直方图将数值分组到一个一个的bucket当中,然后计算每个bucket中值出现次数。在直方图上,X轴表示表示数值的范围,Y轴表示对应数值出现的频次。在直方图上,对于各数值出现的次数,分布是否对称都显示的很清楚。官.原创 2021-04-06 18:56:51 · 6445 阅读 · 1 评论 -
Grafana可视化工具-之仪表测量(Gauge)图
仪表测量(Gauge)图介绍Gauge 和Bar Gauge 均是 Grafana 的原生插件,使用简单。Grafana 有几个版是将 Gauge 放在了 Singlestat 中。但 Singlestat 只支持返回单个序列/表的查询,而 Gauge 是可以支持同时有多个查询(返回多个值)的,并显示多个仪表测量(Gauge)图。使用 Gauge 实现仪表测量效果图,展示如下:注意:还可以 Value mappings 把数字映射成文字Gauge 具体设置方法General 一般设.原创 2021-04-02 14:06:17 · 7349 阅读 · 0 评论 -
处理K8S中日志收集filebeat报异常
处理K8S中日志收集filebeat报异常错误信息INFO producer/broker/51 maximum request accumulated, waiting for space解决办法1、修改filebeat的配置文件添加如下: topic: '%{[fields][log_type]}' partition.round_robin: reachable_only: false required_acks: 1 .原创 2021-04-01 17:50:35 · 1819 阅读 · 0 评论 -
Grafana可视化工具-之表格图开发
Grafana可视化工具-之表格图开发Table Panel也是Grafana的原生插件,Table Panel支持将基于时间序列的多种数据以表格式形式展示,Table Panel灵活且相对复杂Data:控制如何将查询转换为表包括Table Transform(表格转换)和ColumnsTable Transform:这是将数据/度量查询转换成表格式的主要选项可设置为Time series to rows、Time series to columns、Time series aggrega.原创 2021-04-01 13:57:35 · 5551 阅读 · 2 评论 -
Grafana可视化工具-之仪表盘开发
Grafana可视化工具-之仪表盘如何开发1、仪表盘的一般配置2、仪表盘的变量设置使用正则处理获取的值3、仪表盘的曲线图一般配置指标配置定义坐标轴用于坐标轴和网格的显示方式,包括单位,比例,标签等图形设置Legend:查询结果美化勾选show则会显示右边的values勾选as table则会如图所示按table形式分别展示结果显示样式告警见之前的文档https://www.showdoc.com.cn/1086716137363617?page_id.原创 2021-03-25 15:55:25 · 3131 阅读 · 1 评论 -
node_exporter监控指标
1、Node_exporter监控agent存活PromQL语句:up{job="捷顺监控"} == 0说明:检测Node_exporter监控agent是否存活、或者是Node_exporter服务是否挂掉2、Node_exporter监控CPU利用率PromQL语句:ceil(100 - sum(increase(node_cpu_seconds_total{job="捷顺监控",mode="idle"}[5m])) by(instance) / sum(increase(node_cp原创 2020-12-04 17:27:36 · 5971 阅读 · 0 评论 -
安装blackbox_exporter
安装blackbox_exporter上传监控软件cd /opt/ ;scp root@62.234.150.127:/opt/blackbox_exporter-0.16.0.linux-amd64.tar.gz /opt解压操作[root@gtcq-gt-monitor-prometheus-01 opt]# tar -zxvf blackbox_exporter-0.16.0.linux-amd64.tar.gz -C /usr/local/blackbox_exporter-0.16.原创 2020-10-17 19:04:47 · 3705 阅读 · 1 评论 -
记录一次K8S的容器压测监控
记录一次K8S的容器压测基本情况服务名称POD数量POD规格压测并发数压测时间用户中心登录服务1个POD1C2G30个用户登录2hGC情况YGC次数YGC/毫秒FGC次数FGCT/毫秒GCT/毫秒6849209.355123.190212.545总结:FGC次数在2小时中只进行了12次,耗时3.190毫秒;YGC总共6849次,耗时209.355毫秒;监控POD内存使用情况PromQL:topk(5,round(.原创 2020-10-17 15:54:36 · 1749 阅读 · 2 评论 -
安装kafka_exporter集群监控
安装kafka集群监控安装步骤[root@gtcq-gt-resource2-db-01 opt]# cd /opt/ ;scp root@10.152.17.11:/opt/kafka* /optroot@10.152.17.11's password: kafka_exporter-1.2.0.linux-amd64.tar.gz .原创 2020-10-17 10:47:23 · 2525 阅读 · 1 评论 -
安装elasticsearch_exporter监控
安装elasticsearch_exporter下载软件包[root@VM-39-7-centos opt]# wget https://github.com/justwatchcom/elasticsearch_exporter/releases/download/v1.1.0/elasticsearch_exporter-1.1.0.linux-amd64.tar.gz安装启动tar -zxvf elasticsearch_exporter-1.1.0.linux-amd64.tar.g.原创 2020-10-17 10:44:03 · 2472 阅读 · 2 评论 -
安装mysqld_exporter监控
安装mysqld_exporter上传监控软件[root@gtcq-gt-monitor-prometheus-01 opt]# scp root@62.234.150.127:/opt/mysqld_exporter-0.11.0.linux-amd64.tar.gz ./解压操作[root@gtcq-gt-monitor-prometheus-01 opt]# tar -zxvf mysqld_exporter-0.11.0.linux-amd64.tar.gz -C /usr/loca.原创 2020-10-16 14:46:52 · 1941 阅读 · 0 评论 -
安装redis_exporter监控redis集群
安装redis_exporter下载软件包[root@gtcq-gt-resource2-db-03 ~]# cd /opt/ ;scp root@10.152.17.11:/opt/redis_exporter-v1.6.1.linux-amd64.tar.gz /opt安装启动[root@gtcq-gt-resource2-db-03 opt]# tar -zxvf redis_exporter-v1.6.1.linux-amd64.tar.gz -C /usr/local/[roo.原创 2020-10-15 18:56:20 · 5853 阅读 · 4 评论 -
安装node_exporter监控主机
安装node_exporter上传安装包cd /opt/ ;scp root@62.234.150.127:/opt/node_exporter-0.16.0.linux-amd64.tar.gz /optcd /opt/ ;scp root@10.152.17.11:/opt/node_exporter-0.16.0.linux-amd64.tar.gz /opt解压启动服务cd /opt/tar -zxvf node_exporter-0.16.0.linux-amd64.tar.gz.原创 2020-10-15 18:55:15 · 828 阅读 · 0 评论 -
简易安装Prometheus2.x版本
Prometheus安装上传监控软件cd /opt/ ;scp root@62.234.150.128:/optprometheus-2.5.0.linux-amd64.tar.gz /opt解压安装操作[root@localhost opt]# tar -zxvf prometheus-2.5.0.linux-amd64.tar.gz -C /usr/local/;cd /usr/local/;mv prometheus-2.5.0.linux-amd64 prometheus设置syst.原创 2020-10-15 14:33:44 · 297 阅读 · 0 评论 -
Prometheus监控服务器内存监控
Prometheus监控服务器内存监控异常现象监控的centos7使用Prometheus2.5的node_exporter1.6一直收到微信告警信息如下:然后登陆服务器查询,执行命令free -m,信息如下:发现:告警信息和实际服务器信息不一致;处理过程查询PromQL公式:ceil(100 - (((node_memory_MemFree_bytes{job="gtcq-gt-devops-node-exporter"} + node_memory_Buffers_bytes{jo.原创 2020-10-14 11:00:01 · 3474 阅读 · 1 评论 -
K8S体系监控-cadvisor监控
K8S体系监控背景由于业务容器化的推进,对K8S上运行的业务,也必须做到向之前物理机/虚拟机上一样,要有完备的监控保障。但是,毕竟K8S不是物理机/虚拟机,由于技术实现方式不同,监控方面也是有一定差别的。Pod是K8S上调度的最小单元,本文就K8S Pod Docker容器该如何监控进行说明。promethes容器内存监控round(sum by(name, id, job, node) (container_memory_rss{image!=""}) / sum by(name, id, .原创 2020-10-09 18:42:41 · 5067 阅读 · 0 评论 -
K8S体系监控-kube-state-metrics集群资源监控
kube-state-metrics 指标数据1、kube-state-metrics说明kube-state-metrics关注于获取k8s各种资源的最新状态,如deployment或者daemonset,之所以没有把kube-state-metrics纳入到metric-server的能力中,是因为他们的关注点本质上是不一样的。metric-server仅仅是获取、格式化现有数据,写入特定的存储,实质上是一个监控系统。而kube-state-metrics是将k8s的运行状况在内存中做了个快照,.原创 2020-10-09 18:41:18 · 10063 阅读 · 5 评论 -
企业级 Harbor 镜像仓库
作者:夏京文章名称:企业级 Harbor 镜像仓库1、安装docker与docker-compose 上传docker-compose-Linux-x86_64 到opt目录 [root@marketing-testserver-01 opt]# mv docker-compose-Linux-x86_64 /usr/bin/docker-compose [root@marketing-testserver-01 opt]# chmod +x /usr/bin/docker-comp.原创 2020-07-01 17:44:09 · 167 阅读 · 1 评论 -
docker技术谁主沉浮
作者:京哥 docker技术介绍1、docker改变了什么?环境 192.168.29.157面向产品:产品交互面向开发:简化环境配置面向测试:多版本测试面向运维:环境一致性面向架构:自动化扩容缩容(微服务)2、docker的安装安装yum源 由于自带 yum 没有 Docker-CE 所以我们需要先增加 docker repo:yum-config-manager --add-repo https://download.docker.com/linux/centos/.原创 2020-06-15 10:51:22 · 1788 阅读 · 1 评论