自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(127)
  • 收藏
  • 关注

原创 18张图带你入门最新版JumpServer

环境要求docker-cePython3+mysql5.6+Redis1 Ubuntu 安装 docker-ce 环境参考文档https://docs.docker.com/engine/install/debian/https://mirrors.tuna.tsinghua.edu.cn/help/docker-ce/卸载旧版sudo apt-get remove docker docker-engine docker.io containerd runc安装依赖sudo

2021-05-06 17:34:24 7799 20

原创 Jenkins部署与基础配置(2)

jenkins pipeline

2022-11-28 17:35:04 826 1

原创 Jenkins部署与基础配置(1)

!/bin/bash#构建后登录 Jenkins Master 查看结果app1。

2022-11-28 11:42:33 1285

原创 docker 夯住,无法启动

IDC 机架调整,master 机器挪动之后,docker 夯住,无法启动

2022-10-23 09:50:17 1469

原创 redis使用本地磁盘做pvc

这个 local 稍微有点特殊,他是 lazy provision 的(volumeBindingMode: WaitForFirstConsumer),需要创建 pod 引用才可以(waiting for first consumer to be created before binding)处于 Bound 状态

2022-10-15 18:49:38 1369

原创 kubeadm修改pod数(默认值110)

Kubelet上运行的Pod数(默认值110)

2022-10-13 19:03:45 684

原创 在k8s上部署cerebro访问集群外部署的es

在 k8s 集群中安装一个 corebro,用于查看集群外的 Elasticsearch 服务

2022-07-22 20:31:43 868

原创 使用 Helm3 部署 Loki

Loki仅索引日志的元数据部分,日志部分全部压缩存储并以块的形式存储在对象存储(如S3)中,或者本地文件系统中,这样小索引和高度压缩的块在方便操作的同时又节能我们存储空间和成本

2022-06-26 18:37:55 2513

原创 k8s 部署 filebeat 7.10.1 和 logstash 7.10.1

k8s 部署 filebeat 7.10.1 和 logstash 7.10.1

2022-06-12 16:20:38 1076

原创 k8s Operator 部署 elasticsearch 7.10 + kibana + cerebro

基于 Kubernetes Operator 模式部署 elasticsearch kifana cerebro

2022-06-10 19:15:27 1401

原创 物理机重启后ES无法访问

master_not_discovered_exceptionnot enough master nodes discovered during pingingfailed to send join request to master

2022-05-03 10:54:48 1628

原创 在本地电脑访问多个k8s集群

背景:由于需要管理多个 K8s 集群,如果每个集群都登录到 k8s 的 master 上去管理,非常不方便,最好是能从本地个人计算机连接1 kubectl的安装步骤https://cloud.baidu.com/doc/CCE/s/6jxpotcn52 将集群的 config 信息存放到一个文件中bj-k8s 集群中执行 cat ~/.kube/config 获取,放到本地个人计算机相同的目录MacBook-Pro .kube % cat bj-k8sapiVersion: v1cluste

2022-04-24 08:52:01 529

原创 helm3 方式安装 grafana

helm repo updatehelm search repo grafana

2022-04-05 17:20:42 2516

原创 es 错误处理(this cluster currently has [3002]/[3000] maximum shards open)

问题:ES 莫名其妙宕机查看 Elasticsearch 日志如下[2022-03-22T09:00:02,430][WARN ][o.e.x.m.e.l.LocalExporter] [aibee-devops-es03] unexpected error while indexing monitoring documentorg.elasticsearch.xpack.monitoring.exporter.ExportException: [.monitoring-es-7-2022.03.22

2022-04-01 08:45:17 3515

原创 docker网络错误(network bridge not found)

问题:docker 没有网络模型了root@sh-gpu102:~# docker run -it -d -v /mnt:/mnt -v /ssd:/ssd registry.test.cn/more/lite:2.7.0.1542.4e07369dece9b6df7a13285a53877dc016f518a7657abbe9c03c861a34ec1472b7789b3docker: Error response from daemon: network bridge not found.roo

2022-03-16 08:06:18 4780

原创 k8s 自动清理完成的 job

需求:自动清理完成的 job[root@iZbp deploy]# kubectl get node -o wideNAME STATUS ROLES AGE VERSION INTERNAL-IP EXTERNAL-IP OS-IMAGE KERNEL-VERSION CONTA

2022-03-05 09:06:48 1281

原创 K8s集群重启与恢复-Node节点启停

在实际工作中,可能某个 Worker 节点需要维护,迁移,我们需要平滑的停止、启动该节点,应尽量减少启停中对集群、业务造成的影响

2022-03-01 22:20:30 10187 1

原创 K8s集群重启与恢复-Master节点启停

在实际工作中,可能某个 Master 节点需要维护,迁移,我们需要平滑的停止、启动该节点,尽量减少启停中对集群造成的影响

2022-03-01 21:59:42 18479 2

原创 kubeadm join 集群报错 error execution phase kubelet-start 处理

error execution phase kubelet-start: error uploading crisocket: timed out waiting for the condition

2022-02-16 20:41:44 3222 1

原创 在运行一段时间的集群中加入新的节点(k8s-node)

前言:新部署的 k8s 集群添加 node 节点,只需要 kubeadm join 即可,如果一个集群运行一段时间后,再需要添加 node ,由于 token 和 sha256 编码没有记录,需要重新查看

2022-01-21 19:56:47 2200 2

原创 nvidia-docker runtime报错(Unknown runtime specified nvidia)

docker: Error response from daemon: Unknown runtime specified nvidia

2022-01-13 21:36:27 7534 2

原创 内部镜像无法下载的处理过程

周末下午一同事反应机器无法 pull 镜像了,遂登陆机器查看,排查步骤如下:1.首先查看/etc/docker/daemon.json 是否有内部 harbor 配置[root@qa-gpu018 ~]# cat /etc/docker/daemon.json{ "insecure-registries": ["harbor.test.con"] }[root@qa-gpu018 ~]#2.ping 域名检查,网络是否通[root@qa-gpu018] ping harbor.test.

2022-01-09 12:10:04 940

原创 分布式存储概述

1 存储分类单机存储SCSI/IDE/SATA//SAS/USB/PCI-E/SSD/M.2 NVME 协议(提升性能)网络存储(带文件系统)NFSSambaNAS (Network Attached Storage:网络附属存储)SAN:SAN(Storage Area Network,存储区域网络)存储选择单机单机存储的磁盘空间问题、IO 问题、扩容问题、高可用问题商业商业解决方案-EMC、NetAPP、戴尔、华为、浪潮

2022-01-03 17:04:06 1066

原创 k8s中ingress公有云迁移记录

业务需求:几个服务从某公有云环境迁移到另一个公有云环境,分为三个步骤在新的公有云环境中发布 svc 和 deploy,configmap,secret在新的公有云环境中发布 ingress,发布完成后,绑定 hosts 进行测试在第二步测试访问无异常后,解析域名到新的公有云的 k8s 的负载均衡器上由于我们的这几个业务没有承接线上流量,开发人员先解析了域名,然后再部署的 ingress,在新部署 ingress 的过程中,发生了下面的错误,联系我解决,故,记录下来,也方便开发人员查看错误1:i

2021-12-30 21:19:42 596

原创 生产环境中调整docker数据目录

由于 docker 安装的目录问题,导致根路径将要满了,而数据目录则没有使用,所以准备调整 docker 的数据目录[root@web02 lib]# df -h文件系统 容量 已用 可用 已用% 挂载点devtmpfs 7.8G 0 7.8G 0% /devtmpfs 7.9G 0 7.9G 0% /dev/shmtmpfs

2021-12-26 16:19:40 650

原创 jenkins-deleteDir报错(FilePath is missing)

今天开发反馈一直使用好好的 jenkins 编译服务,居然报错了看日志,说是 deleteDir 出了问题org.jenkinsci.plugins.workflow.steps.MissingContextVariableException: Required context class hudson.FilePath is missingPerhaps you forgot to surround the code with a step that provides this, such as:

2021-12-15 23:04:39 3584

原创 k8s pod 更换命名空间步骤

在实际生产中,有些 pod 由于需要更换命名空间(namespace),如果没有原始的 yaml 文件,就需要将现有的 pod 信息导出,修改后,重新 apply1.新建文件夹root@master1:~# mkdir bi-parking-lotroot@master1:~# mkdir mall-bi-systemroot@master1:~# mkdir scpg-ta-service2.导出 ingresskubectl get ingress -n project-keycloak

2021-12-07 21:07:16 4406 2

原创 failed to register layer: open xxx no such file or directory

今天遇到一个镜像下载失败的问题,如下failed to register layer: open /ssd/docker/overlay2/8b59377a7b63cd2014d31a3a885353c107f2aad1fb07886c92e1aa35732b3d21/committed: no such file or directory搜索网上的解决办法,比如docker system prune -a然后systemctl stop dockersystemctl start doc

2021-11-29 21:44:39 2643

原创 Prometheus邮件报警设置

1. 告警功能概述Prometheus 对指标的收集、存储同告警能力分别属于 Prometheus Server 和 AlertManager 两个独立的组件,前者仅负责基于“告警规则”生成告警通知,具体的告警操作则由后者完成Alertmanager 负责处理由客户端发来的告警通知客户端通常是 Prometheus Server,但它也支持接收来自其他工具的告警Alertmanager 对告警通知进行分组、去重后,根据路由规则将其路由到不同的 receiver,如 Email、短信或Pag

2021-11-28 19:45:27 3705

原创 Prometheus主机(node)监控

9 Prometheus node 监控# 安装 node_exporter[root@promethues ~]# tar zxvf node_exporter-1.2.2.linux-amd64.tar.gz -C /usr/local/node_exporter-1.2.2.linux-amd64/node_exporter-1.2.2.linux-amd64/LICENSEnode_exporter-1.2.2.linux-amd64/NOTICEnode_exporter-1.2.2.

2021-10-31 22:12:15 930

原创 Prometheus安装

1. 安装 Prometheus# 官网https://prometheus.io/download/[root@promethues ~]# tar zxvf prometheus-2.30.3.linux-amd64.tar.gz -C /usr/local/[root@promethues ~]# ln -sv /usr/local/prometheus-2.30.3.linux-amd64 /usr/local/prometheus[root@promethues ~]# mkdir -

2021-10-31 18:35:40 265

原创 解决es集群Yellow与Red的问题

1. 集群健康度分片健康,在集群中节点的状态有三种:绿色、黄色、红色红色:至少有一个主分片没有分配,表示集群无法正常工作。黄色:表示节点的运行状态为警告状态,所有的主分片目前都可以直接运行,但是至少有一个副本分片是不能正常工作的。绿色:节点运行状态为健康状态。所有的主分片、副本分片都可以正常工作。索引健康:最差的分片的状态集群健康:最差的索引的状态2. Health相关的API解释API集群的状态(检查节点数量)GET _cluster/

2021-10-27 14:25:07 3666

原创 elasticsearch的索引(增删改查)管理

1. 创建索引# 语法PUT /索引名/[类型名]/文档id{ 请求体}可以通过 postman 发送请求,也可以通过 kibana 发送请求,由于 kibana 有提示,所以我们选择kibana索引名不能有大写字母PUT Book{ "error" : { "root_cause" : [ { "type" : "invalid_index_name_exception", "reason" : "Invalid inde

2021-10-27 10:30:20 1477

原创 gitlab部署与使用

2 Gitlab 部署与使用# Gitlab 服务的安装文档https://about.gitlab.com/install/ # 安装环境要求https://docs.gitlab.com/ce/install/requirements.html # 安装包下载地址https://packages.gitlab.com/gitlab/gitlab-ce# rpm 包国内下载地址https://mirrors.tuna.tsinghua.edu.cn/gitlab-ce/yum/#

2021-10-24 13:06:34 5786

原创 docker和k8s面试题总结(未完待续)

docker 有四种网络模式none桥接(默认模式)Hostcontainer容器之间通过桥接模式进行通信跨主机的容器之间通过静态路由进行通信,A主机的容器的下一跳指向B主机,这样B主机接收到请求解包后转发给本机的容器容器其实就是 Namespace + CgroupsNamespace:帮助容器实现各种资源的隔离Cgroups:主要对容器使用某种资源量的多少做一个限制docker 使用宿主机的内核,启动速度快,隔离性差,docker 确切来说是一个容器引擎虚拟机使用自己的内核,启动速度慢,因为有自己的内核

2021-10-22 12:42:29 14041

原创 Elasticsearch优化的一些建议

1. 增大系统打开文件数调大系统的“最大打开文件数” ,建议32K甚至是64Kulimit -a(查看)ulimit -n 32000(设置)2. 合理设置JVM内存修改配置文件调整ES的JVM内存大小。修改jvm.options中-Xms和-Xmx的大小,建议设置一样大, 避免频繁的分配内存。 根据服务器内存大小, 一般分配50%左右(默认1g)3. 锁定物理内存设置memory_lock来锁定进程的物理内存地址,避免内存交换(swapped) 来提高性能# 修改文件vi c

2021-10-22 08:51:54 1071

原创 kubectl命令行管理工具

kubectl 就是 kube-apiserver 的客户端程序,是通过连接 master 节点的 apiserver 上实现各种 k8s 相关对象资源的增删改查

2021-10-14 18:21:32 625

原创 k8s 发布项目实现 nginx 和 tomcat 动静分离(2)

3 部署 dashboardhttps://github.com/kubernetes/dashboard3.1 部署 dashboard v2.3.1[root@K8s-master1 ~]# wget https://raw.githubusercontent.com/kubernetes/dashboard/v2.3.1/aio/deploy/recommended.yaml[root@K8s-master1 ~]# mv recommended.yaml dashboard-2.3.1

2021-09-27 21:29:18 1383 2

原创 kubeadm安装部署k8s(1)

2 K8s 安装部署2.1 安装方式2.1.1 部署工具使用批量部署工具(anbile / slatstack)、手动二进制、kebeadm、apt-get/yum 等方式安装、以守护进程的方式启动在宿主机上,类似于是 Nginx 一样使用 service 脚本启动二进制部署:兼容性最好,类似于在宿主机上启动了一个服务,这个服务可以直接使用宿主机内核的很多特性kubeadm部署:以容器的方式启动,会在宿主机上启动很多容器,比如 api-server 容器、controller manager

2021-09-27 21:26:26 1017 1

原创 网络性能指标工具

性能指标工具说明吞吐量(BPS)sarnethogsiftop分别可以查看网络接口、进程以及 IP 地址的网络吞吐量PPSsar/proc/net/dev查看网络接口的 PPS连接数netstatss查看网络连接数延迟pinghping3通过 ICMP、TCP等测试网络延迟连接跟踪数conntrack查看和管理连接跟踪状况路由mtrroutetraceroute查看路由并测试链路信息DNSdignslookup排查 DNS...

2021-09-22 10:33:59 346

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除