自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

CN_Eden

一个需要努力的人

  • 博客(327)
  • 资源 (32)
  • 收藏
  • 关注

原创 【APM】Grafana配置Loki3.1.1

添加一个loki源,填写暴露的loki地址。需要与promtail配置的。另外这里需要添加一个。

2024-09-29 16:15:39 20

原创 【APM】在Kubernetes中,使用Helm安装Promtail 3.0.0

Promtail 是一款由 Grafana Labs 开发的日志收集代理软件,设计用于与 Loki 日志聚合系统紧密协作。Loki 是一个高度可扩展、高可用性且支持多租户的日志管理系统,其设计理念受到了 Prometheus 监控系统的启发,特别注重效率和易用性。不同于传统日志管理系统,Loki 不对日志内容进行全文索引,而是依赖标签(labels)来索引和查询日志,从而实现了资源的有效利用。

2024-09-29 16:07:24 66

原创 【问题记录】promtail报错:caller=client.go:430 component=client host=loki-devtest-gateway.dev.svc.cluster.loc

这种情况如果是在promtail服务报出来的,大概率是因为loki的版本已经升级到了3.0.0版本,根据。,所以我们设置 一个。

2024-09-29 15:50:38 29

原创 【APM】在Kubernetes中,使用Helm安装loki-distributed 3.1.1

to target a specific tenant. For each tenant, you can create a different datasource.”我们需要在配置数据源的时候都要指定租户名称,比如在配置grafana、Alertmanager、promtail等。该内容从grafana官网文档获取:https://grafana.com/docs/loki/v3.1.x/setup/install/helm/install-microservices/

2024-09-29 15:32:12 53

原创 【云原生】使用Harbor代理dockerhub拉取镜像

最近回归使用istio,又遇到了容器镜像从dockerhub拉取不下来的问题,实在是忍无可忍了,准备在香港地域安装Harbor作为代理节点拉取镜像。

2024-07-17 14:35:42 964

原创 【问题记录】连接Seata报错: ERROR 1[TID: N/A][uId:][sId:][tId:][timeoutChecker_1_1]i.s.c.r.netty.NettyClientC

seata启动成功了,注册到nacos也成功了,但是服务还是报: ERROR 1[TID: N/A][uId:][sId:][tId:][timeoutChecker_1_1]i.s.c.r.netty.NettyClientChannelManager 0101 can not connect to 172.20.239.75:8091 cause:can not register RM,err:can not connect to services-server。

2024-07-15 14:22:53 313

原创 【云原生】AWS云平台,ECR推送Helm chart包

背景三:随着兼容 OCI 规范的 Helm Chart 在社区上被更广泛地接受,Helm Chart 能以 Artifact 的形式在 Harbor 中存储和管理,不再依赖 ChartMuseum,Harbor从 v2.6.0 开始弃用 Chartmuseum,并在 v2.8.0 中开始删除。1)容器镜像格式规范 (Image Specification):规定了容器镜像应该包含什么以及如何构建和分发镜像,以便容器可以在任何遵循 OCI 标准的运行时中运行。所以,建议大家还是尽快使用OCI规范。

2024-07-08 14:12:51 591

原创 【问题记录】Jenkins Pipeline读取变量的各种方法

先使用shell把执行后的结果赋值到一个文本,然后读取文本内容赋值给。另外,如果想输出docker image命令执行结果给。输出docker image镜像标签给。其实就是拆分上面的语句。

2024-07-05 11:12:31 484

原创 【问题记录】AWS EKS集群使用EFS做为StorageClass,minio报(.minio.sys/pool.bin) returned an error (file access denied

基于文章延伸的问题上一篇有写Mysql目录权限问题,现在minio也是相同的问题,mysql修改不了用户所属主,但是minio可以修改。

2024-07-02 16:41:16 397

原创 【问题记录】AWS EKS集群使用EFS做为StorageClass,mysql目录权限问题:chown: changing ownership of ‘/var/lib/mysql/‘: Opera

基于文章延伸的问题。

2024-07-02 15:15:13 246

原创 【问题记录】returned HTTP status 429 Too Many Requests (429): Maximum active stream limit exceeded

ELK(Elasticsearch、Logstash、Kibana)日志分析系统长期以来一直是日志管理和分析领域的主流选择,但随着技术的发展和特定场景的需求变化,一些组织开始考虑迁移到如Loki这样的新型日志系统。Loki是专为云原生和Kubernetes环境设计的,它与Kubernetes的原生集成更好,可以自动发现服务和标签,简化了部署和维护过程。虽然ELK生态成熟且广泛,Loki作为CNCF项目,随着其在云原生领域的普及,生态也在快速增长,提供了更多的工具和集成选项。错误,并且收集日志很慢。

2024-06-27 10:41:49 251

原创 【GitOps】使用Google工具JIB实现本地无需安装容器推送镜像,加速SpringCloud项目开发

Jib 是 Google 开发的一款开源工具,旨在帮助 Java 开发者更高效地将 Java 应用程序构建为 Docker 容器镜像或 OCI(Open Container Initiative)镜像。Jib 以 Maven 和 Gradle 插件的形式存在,因此它可以无缝集成到现有的Java构建流程中,而无需开发者手动编写 Dockerfile 或运行 Docker 守护进程。

2024-06-26 18:04:32 203

原创 【问题记录】Kubernetes搭建Redis7版本6节点集群,出现节点之间集群连接失败问题:10.0.9.18:6379@16379 master,fail?

10.0.2.195 是要把那个节点加入到集群,这里是redis-sts-1的ip,以此类推,把剩余4个节点都加进来即可。你可以使用redis-cli的cluster meet命令来让节点重新加入集群。但是只能适合至少有一个节点时正常的情况下,比如6个节点,有一个时正常的。这里是新节点的IP地址,是节点的端口。各个节点之间相互连接失败。

2024-06-18 13:32:40 345

原创 【APM】在Kubernetes中搭建OpenTelemetry+Loki+Tempo+Grafana链路追踪(实战二,Tempo Service Graph)

一条完整的链路包含trace和span一个trace包含多个span,组合起来一般是时间轴的方式展示,如Jaeger和Tempo等单独看span,会包含多个父子关系,更像一个族谱,每一个span会基于Span A继续传承下去,直到它没有“子嗣”而停止传承| || || |↑↑↑使用OpenTelemetry Agent后,会帮助我们把链路数据转换成otlp协议,一般收集上来的span字段足够我们使用,所以这一块我们不需要额外做啥工作,直接拿来使用即可。

2024-05-28 15:41:54 441

原创 【APM】在Kubernetes中,使用Helm安装Prometheus Server 0.73.2(开启远程写入功能)

负责从各个exporter收集时间序列数据,并存储这些数据以便后续查询和分析。它是整个监控系统的核心部分,负责数据的抓取、存储、查询和报警触发的基础数据处理。: 负责处理由Prometheus Server生成的警报,包括去重、分组、路由警报到正确的接收者,并支持多种通知方式(如邮件、短信、聊天工具等)。它确保警报策略的执行,并且具有高可用性设计。

2024-05-21 15:36:54 724

原创 【APM】在Kubernetes中搭建OpenTelemetry+Loki+Tempo+Grafana链路追踪(实战一,Loki日志中查看链路追踪数据)

这对于那些不能直接控制 JVM 启动参数的应用特别有用,比如通过 JNI (Java Native Interface) 调用 JVM 的应用、脚本中嵌入的 JVM 应用,或者一些服务管理工具自动启动的服务。这为用户提供了一个灵活的架构,可以根据需要选择最适合自己的追踪解决方案,或者根据环境(如开发、测试、生产)的不同配置不同的后端。: OpenTelemetry SDK 提供了丰富的特性,如自动追踪上下文传播、手动追踪跨度的创建与关联、标签和事件的添加等,使得追踪数据更加丰富和有用。

2024-05-13 18:46:12 1655

原创 【APM】在Kubernetes中,使用Helm安装OpenTelemetry 0.97.0(无侵入式)

OpenTelemetry 是一个开源的、全面的可观测性框架,旨在为云原生及传统应用提供标准化的方式来生成、收集、处理和导出遥测数据,包括跟踪(Traces)、度量(Metrics)和日志(Logs)。这个项目由 Cloud Native Computing Foundation (CNCF) 孵化,目标是简化和统一观测性数据的收集与分析,从而提高开发人员在分布式系统中调试和监控应用的能力。

2024-05-13 17:52:55 556

原创 【APM】在Kubernetes中,使用Helm安装tempo-distributed 2.4.1

这是 Grafana Tempo 的核心组件,负责接收、处理和存储追踪数据。它支持从各种追踪源(如 Jaeger、OpenTelemetry 等)接收数据,并将数据高效地存储到后端存储系统中(通常是对象存储服务,如 AWS S3、Google Cloud Storage 或 Azure Blob Storage)。Tempo Server 还提供了查询 API,用于检索存储的追踪数据。: 负责接收追踪数据并对其进行分配,实现负载均衡。它确保高并发写入时的服务稳定性。Ingester。

2024-05-13 16:55:55 805

原创 【APM】在Kubernetes中,使用Helm安装Promtail 2.9.3

Promtail 是一款由 Grafana Labs 开发的日志收集代理软件,设计用于与 Loki 日志聚合系统紧密协作。Loki 是一个高度可扩展、高可用性且支持多租户的日志管理系统,其设计理念受到了 Prometheus 监控系统的启发,特别注重效率和易用性。不同于传统日志管理系统,Loki 不对日志内容进行全文索引,而是依赖标签(labels)来索引和查询日志,从而实现了资源的有效利用。

2024-05-13 14:17:57 432

原创 【APM】在Kubernetes中,使用Helm安装loki-distributed 2.9.6

Grafana Loki 是一个开源的云原生日志聚合和分析系统,由 Grafana Labs 开发并维护。Loki 专注于为大规模的日志处理提供经济高效且易于管理的解决方案,尤其适用于微服务架构以及容器化和分布式环境。综上所述,Grafana Loki 旨在简化日志管理,并通过其创新的设计,为企业提供了在现代云环境中处理日志的一种高效且经济的方式。

2024-05-13 13:52:39 964

原创 【APM】在Kubernetes中,使用Helm安装Grafana 9.5.1

Grafana是一款流行的开源数据可视化和分析平台,它特别擅长处理时序数据,即随时间变化的数据,因此在监控系统性能、应用程序指标、物联网(IoT)设备数据等领域有着广泛的应用。

2024-05-13 13:23:20 650

原创 【APM】Grafana修改null数据为自定义内容

自定义显示内容

2024-05-09 13:46:14 411

原创 【DevOps】使用Filebeat收集华为云cce containerd日志

通过 Kubernetes 的 Container Runtime Interface (CRI),kubelet 可以直接与 containerd 进行通信,无需经过 Docker 的 shim 层,简化了调用链路,降低了潜在的故障点,从而提高系统的稳定性和安全性。总结来说,从 Docker 迁移到 containerd,特别是在 Kubernetes 集群环境下,可以得到更高的性能、更好的资源利用率、更强的稳定性以及更简洁的架构,这些优势对于大规模生产环境尤其重要。如上图,真正存放容器路径的位置是在。

2024-04-01 14:21:15 241

原创 【HPA】华为云CCE根据Prometheus Adapter 自定义custom和external业务指标,实现业务Pod自动扩缩容(更新:2024.4.1)

到目前为止,我们准备好了Exporter、Prometheus、Adapter,接下来是最关键的一步,也是核心步骤,我们把他们串一起从上面原理图分析,可以得到下面的图。

2024-04-01 09:34:01 328

原创 【问题记录】kubernetes hpa数据时有时无

监控数据的采集是Prometheus的核心功能,定期抓取的数据会被存储在本地TSDB(Time Series Database)中,供后续查询、可视化和告警使用。总结来说,这段配置决定了Prometheus服务器每5分钟(evaluation_interval 和 scrape_interval 都为 5m)执行一次规则评估和数据抓取,并在每次数据抓取时最多等待30秒(scrape_timeout 为 30s)获取目标的监控数据。这样配置的话,全局抓取的数据时间间隔都会变,抓紧自定义指标,可使用单独的。

2024-03-26 17:16:38 676

原创 【问题记录】Istio与Prometheus冲突问题,“GET /metrics HTTP/1.1“ 503 UF upstream_reset_before_response_started{rem

使用istio官网提供的安装方式,默认会安装loki、kiali、prometheus、grafana,如果自己再搭建一个prometheus,会出现冲突。此时,istio代理的服务没有出现以上错误请求,具体原因还在查找中。删除了添加这种pod的注释,改为手动添加。

2024-03-26 17:00:48 291 1

原创 【问题记录】自定义Prometheus exporter收集数据,Prometheus显示收集到数据,grafana未显示数据出来

3、自定义指标最小时间是ms级别,所有需配置下Prometheus的采集率为一秒一次(应该配置成毫秒的,目前Prometheus不支持)使用golang编写Prometheus exporter,获取指定API Url返回值中的data值,把它做为自定义指标。在grafana中获取不到Prometheus的Graph界面的值,即根据 PromQL 的查询结果。这个问题其实很简单,默认数据间隔是15s,我们只需要把时间间隔改成1s即可。

2024-03-19 15:03:20 480

原创 【问题记录】zookeeper集群一节点无法启动,报“Unable to load database on disk”

2、删除datalog目录version-2目录。1、删除data目录下的version-2目录。

2024-01-30 15:43:10 83

原创 Kubernetes安装Seata1.8.0(注册到Nacos,连接外置数据库)

Seata 是一款开源的分布式事务解决方案,致力于提供高性能和简单易用的分布式事务服务。Seata 将为用户提供了 AT、TCC、SAGA 和 XA 事务模式,为用户打造一站式的分布式解决方案。seata1.8.0官方介绍。

2024-01-29 16:51:05 577

原创 【DevOps】Jenkins Extended E-mail 邮件模板添加自定义变量

自定义变量:DYSK_PYTEST_STATUS。

2024-01-23 15:09:30 389

原创 【APM】Loki简介

Grafana Loki 是一个开源的云原生日志聚合和分析系统,由 Grafana Labs 开发并维护。Loki 专注于为大规模的日志处理提供经济高效且易于管理的解决方案,尤其适用于微服务架构以及容器化和分布式环境。综上所述,Grafana Loki 旨在简化日志管理,并通过其创新的设计,为企业提供了在现代云环境中处理日志的一种高效且经济的方式。

2024-01-12 14:01:14 331

原创 【APM】Alertmanager+Loki实现Teams告警

在前面的文章我们实现了Loki日志告警,接下来新增一种告警媒介:微软Teams。

2024-01-10 13:36:41 483

原创 【Istio】安装Istio1.20.1

set values.pilot.env.PILOT_ENABLE_ALPHA_GATEWAY_API=true: Gateway API 配置内部网格(东西)流量,即不仅是 Ingress(南北)流量。更多:https://istio.io/latest/zh/docs/tasks/traffic-management/request-routing/配置组合,它包含了适合测试的一系列功能集。如果您的平台提供了自定义配置组合,比如 Openshift,在下面命令中替换。

2024-01-05 15:47:02 557

原创 【APM】Loki+Alertmanager日志告警

设置Loki的日志告警,我们必须借助其他相关服务,Promtail打标签用于过滤日志,Alertmanager用于告警目前为止,Loki并没有打印日志周围几行日志的能力,我们只能打印第一行日志发送告警,大体思路是先截取自己想要的日志把他们打成不同的标签,Alertmanager告警模板定义标签的值发送出去。

2023-12-29 10:49:22 1168

原创 【APM】Loki日志多行显示

修改完成后,重启Promtail服务,再去Grafana查看日志,已经变成多行显示。文章我们搭建了Alertmanager和Loki,接下来我们来实现日志并行显示。我们是需要修改Promtail服务的配置文件即可。

2023-12-29 10:07:49 1068

原创 【APM】安装Prometheus/Loki+Alertmanager+Grafana并实现指标监控告警和日志监控告警

添加监控规则内容是在Prometheus服务中添加的,使用helm部署的Prometheus添加监控规则很简单,正如上面提到的监控规则配置文件configmap,我们只需要修改该文件即可。这个正则表达式的目的是在一段文本中找到包含 "INFO"、"WARN" 或 "ERROR" 的部分,并将这些部分标记为名为 "level" 的捕获组。第二个规则比较好实现,比较创建一个nginx服务,名称:scpo-nginx,副本数2,然后把服务副本数调成1,看看Prometheus和Alertmanager的变化。

2023-12-29 09:37:36 697

原创 【问题记录】Rancher:Post “https://rancher-webhook.cattle-system.svc:443/v1/webhook/validation/namespaces?

第一个Rancher接管华为云CCE集群后,没有解绑后第二个Rancher接入华为云CCE集群遇到了问题,cattle-system命名空间删除不掉,用edit把命名空间spec清空无效,使用。把8001改成kubectl proxy 得到的接口,我这里是8001。删除annotations的finalizers字段。重新删除cattle-system命名空间。2、把命名空间导成json文件。1、开启proxy到本地。

2023-12-28 15:59:38 679

原创 【云原生】华为云踩坑日志(更新于2023.12.10)

CCE 默认拉取 SWR 镜像仓库走内网,但是 SWR 是没有内网地址的,这是他们在内部实现,用户看不到,所以速度快慢取决于华为云相关处理组件。6、CCE 产品有一些界面上做好的功能,但是实际还未对用户开放。9、华为云产品API文档如果按照文档操作的,报403,401等各种问题,不要再找原因了,是他们的API文档部分更新慢,直接提工单让他们提供下最新的API接口文档。2、CCE 涉及到的产品,有的需要查看产品怎么才能被 CCE 使用,两头都得顾,比如SFS产品,必须先创建终端节点,这个必须手动操作。

2023-12-18 16:05:18 949

原创 【日志】Prometheus/Loki+Alertmanager+Grafana监控告警

参考文章:匹配写法:https://blog.ossq.cn/2674.html。

2023-12-12 15:42:17 425

原创 【DevOps】Jenkins:配置jenkins 流水线/多分支流水线任务构建成功通知企业微信@相关人(二)

实现了企业微信通知,但仅仅是Jenkins构建后通知,如果在K8s侧配置了就绪检测和滚动更新,那构建完成并不能代表服务已经发布完成,本篇文章我们就来解决这个问题。以上,输入命名空间和deployment名称,查询该服务不可用的副本数,如果不等于0,将每3秒循环一次查询,并返回。在Jenkinsfile流水线中,新增一个stage,将要发布更新的服务变量。最后,这一步将一直检测服务是否更新完成,直到不可用副本数为0为止。,如果等于0,将终止循环,并返回。接收传参,即之后我们可以使用。和所在的命名空间变量。

2023-12-04 14:31:17 548

表白网页,一定要看下面描述的文档,有制作好的容器镜像,可以直接使用

文档:https://blog.csdn.net/zhanremo3062/article/details/129450461

2023-03-10

表白网页,使用前一定要看下描述中的文档

文档:https://blog.csdn.net/zhanremo3062/article/details/129442822

2023-03-10

表白网页,使用前一定要看下描述里的文档

文档:https://blog.csdn.net/zhanremo3062/article/details/129442117

2023-03-10

表白网页,使用前一定要看下描述里的文档文档哈,感谢大佬支持,专栏19元

天下没有免费的午餐,感谢大佬支持,对应文档:https://blog.csdn.net/zhanremo3062/article/details/129440590

2023-03-10

表白网站,使用前请看下描述中的博客啊

博客19.9元,,天下没有免费的午餐,感谢大家支持!博客地址:https://blog.csdn.net/zhanremo3062/article/details/129440590

2023-03-10

表白网站制作,有相关博客介绍

相关博客地址:https://blog.csdn.net/zhanremo3062/article/details/129413713

2023-03-08

devops演示文件,相关博客:https://blog.csdn.net/zhanremo3062/article/detai

devops演示文件,相关博客:https://blog.csdn.net/zhanremo3062/article/details/120056071

2022-12-04

表白网站源码和只做容器镜像的dockerfile

表白网站源码和只做容器镜像的dockerfile,可以任意更改人名、时间

2022-09-21

sonarqube7.9中文插件包 sonar-l10n-zh-plugin-1.26.jar

相关博客:https://blog.csdn.net/zhanremo3062/article/details/118420279

2022-07-09

自动化运维流程图,打开即用

亿图图示文件,打开后即可编辑

2022-03-09

vfstp-web相关包

相关博客地址:https://blog.csdn.net/zhanremo3062/article/details/123083547?spm=1001.2014.3001.5502

2022-02-24

基于golang开发的vsftp-web服务

ftp+web用户管理界面 安装博客地址:https://blog.csdn.net/zhanremo3062/article/details/123083547?spm=1001.2014.3001.5502 创作不易,感谢大家以来的支持!

2022-02-24

生成阿里云ecs主机监控报表go语言源码

生成阿里云ecs主机监控报表go语言源码,使用说明博客地址:https://blog.csdn.net/zhanremo3062/article/details/122743082

2022-01-29

typora-dev-x64-1117.7z

开发版本makedown工具

2021-12-31

mobaxterm_60585.zip

免费使用版本,超11个会话!

2021-12-31

Postman-win64-9.6.1-Setup.exe

Postman-win64-9.6.1-Setup.exe安装包

2021-12-30

posman9.6.1中文包.zip

不是安装包,是中文包。使用说明:https://blog.csdn.net/zhanremo3062/article/details/122242438

2021-12-30

phptool_for_scws_xdb.zip

xdb转换txt工具

2021-10-08

rancher-driver.7z

相关博客:https://editor.csdn.net/md/?articleId=120240612

2021-09-15

docker-machine.7z

v.0.16.0 docker-machine 组件文件

2021-09-13

test-sonar-master1.zip

相关博客:https://editor.csdn.net/md/?articleId=120056071

2021-09-09

test-sonar-master.zip

涉及到的博客地址:https://editor.csdn.net/md/?articleId=120056071

2021-09-07

awesomeProject.tar.xz

k8s 1.17版本api 对应的client-go(v0.20.4)工具依赖文件

2021-08-25

ferry2.0.tar

ferry工单系统文件2021.8.20

2021-08-20

python3.7.2.zip

Python-3.7.2.tar.xz

2021-05-31

vsftp2.0.tar

go语言编写,GIN框架+GORM模型实现的vsftp添加删除用户web界面资源 相关博客:https://editor.csdn.net/md?not_checkout=1&articleId=117223735

2021-05-24

HTML注册登录页面模板.zip

博客引用资源:https://blog.csdn.net/zhanremo3062/article/details/116781299

2021-05-14

knowhow.zip

wordpress外观,knowhow1.1.16版本

2021-04-30

python-2.7.5-90.el7.x86_64.rpm

python-2.7.5-90.el7.x86_64.rpm

2021-02-25

Git gui 中文化文件zh_cn.zip

git gui中文配置文件

2021-02-07

k8s学习资料.zip

k8s学习资料.zip

2021-02-07

tomcat9.0.37.tar.gz

tomcat9.0.37.tar.gz

2021-02-07

jdk1.8.tar.gz

jdk1.8.tar.gz

2021-02-07

zabbix4.0离线安装.zip

要求: centos7.6 (1810)系统 安装信息: zabbix4.0版本一键安装包,运行其中的sh脚本即可自动安装

2021-01-14

zbx_template_vrgv.xml

针对zabbix监控mysql、nginx、指定端口号和进程的xml模板

2021-01-14

VRGV-zabbix-template-MYSQL.xml

zabbix监控mysql常见参数模板的xml文件

2021-01-11

nginx_status_templates.xml

zabbix监控nginx需要导入到zabbix-web界面的的模板

2021-01-08

zabbix-nginx-status.sh

zabbix监控nginx配置文件

2021-01-08

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除