自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(26)
  • 收藏
  • 关注

原创 python代码备注1

获取阿里镜像仓库版本对比jenkins脚本

2024-04-07 18:32:37 293

原创 pod 网络访问不通简单整理

一:pod非running状态先kubectl describe pod xxx如果说pod是时好时坏,可以logs 查看也可以kubectl exec -it xxx bash什么情况下pod会处于pending状态?(pending状态pod是未分配,只有分配后才会拉取镜像)情况:资源不足;污点;没有节点标签;没有匹配到标签。集群部署类问题:1 网络不通检测方法telnet,ping2 启动失败 (一般是配置文件或者依赖服务)比如apiserver依赖etcd,etcd起不来,api

2022-02-11 18:08:51 5994

转载 Docker打开远程API服务

一.开发环境1.系统环境2.docker版本二.步骤1.查看docker配置文件路径2.编辑配置文件3.重启docker三.测试1.查看docker客户端服务端版本docker -H localhost:2375 version2.ping 测试curl -v -X GET localhost:2375/_ping...

2021-09-17 18:00:46 688

原创 2021-09-17 k8s之CoreDNS

1、CoreDNS 基本概念CoreDNS作为域名发现的项目,原生集成Kubernetes,它的目标是成为云原生的DNS服务器和服务发现的参考解决方案。从Kubernetes 1.12开始,CoreDNS就成了Kubernetes的默认DNS服务器,但 kubeadm默认安装CoreDNS的时间要更早。在Kuberentes 1.9版本中,使用 kubeadm方式安装的集群可以通过以下命令直接安装CoreDNS。kubeadm init --feature-gates=CoreDNS=true从功能

2021-09-17 17:45:41 640

转载 k8s故障排查一

问题一:报错 cannot allocate memory 或者 no space left on device ,修复K8S内存泄露问题问题描述一. 当k8s集群运行日久以后,有的node无法再新建pod,并且出现如下错误,当重启服务器之后,才可以恢复正常使用。查看pod状态的时候会出现以下报错。applying cgroup … caused: mkdir …no space left on device或者在describe pod的时候出现cannot allocate memory这时候

2021-08-06 11:41:39 1033

翻译 500报错及故障排除

500 Internal Server Error每次打开网页时,浏览器都会向托管站点的服务器发送请求,服务器将返回请求的数据和响应代码,HTTP响应状态代码指示请求是否成功。500到599范围内的代码表示服务器错误。该错误不是由浏览器或Internet连接引起的,不过即使错误发生在服务器端,也可以尝试以下一些选项:1、重新加载浏览器或尝试使用另一个浏览器,但是刷新浏览器重新加载页面能处理掉问题的可能较低。2、尝试清除浏览器缓存,如果缓存了显示500错误的页面,则清除缓存后,浏览器将请求该页面的新版

2021-07-28 10:25:26 78615

翻译 k8s的常见问题处理一

一:pod时间同步容器内部的时间点和node节点时间不一致解决方案:将物理机的时区文件以hostpath的方式只读挂载到容器当中,只要保证物理机的时间是准确的即可。问题二:Pod内部hosts文件问题默认情况下,k8s会将pod的hostname和ip地址添加到hosts文件里面,实际应用场景下会有手工追加hosts文件记录的需求,而pod的生命周期是不固定的,因此官方提供了hostalias的解决方案。通过配置pod内部hosts文件的初衷有两个:1 有些微服务之间的调用走的是公网解

2021-07-15 11:35:05 1259

原创 Promethus的PromQL语法

1 统计cpu的使用率(1 - avg (irate(node_cpu_seconds_total{mode=‘idle’}[5m])) by (instance)) * 100mode=‘idle’ 代表空闲还有多少 ,irate 代表速率计算,avg平均,5m每5分钟,instance 实例 *100 除以1002 cpu的饱和度 应该小于(2倍?)cpu的数量node_load 11是一分钟,node平均1分钟的负载node_load 1 > on (instance) 2 *

2021-03-30 17:58:11 27537

翻译 inux下的/dev/shm/ 以及与swap目录的区别

/dev/shm是一个设备文件, 可以把/dev/shm看作是系统内存的入口, 可以把它看做是一块物理存储设备,一个tmp filesystem, 你可以通过这个设备向内存中读写文件, 以加快某些I/O高的操作,比如对一个大型文件频繁的open, write, read,据说oracle就利用了/dev/shm(shitou没用过oracle), 可以通过mount命令列出当前的/dev/shm的挂载的文件系统,你可以直接对/dev/shm进行读写操作, 例如:1#touch /dev/shm/fil

2021-03-17 14:51:36 418

原创 Linux /etc/profile 全局变量

在/etc/profile文件中修改环境变量,对全局作用如何添加环境变量。例如添加”NAME=liheng“ 。在profile文件的最后添加如下内容export NAME=liheng变量值liheng可以加引号也可以不加,效果一样。在profile文件添加或修改的内容需要注销系统才能生效。./etc/profile , /etc/profile.d ,~/.bashrc, ~/.bash_file,这几个文件的区别~/.bashrc, ~/.bash_file这两个看到~这个符合,应该明白,

2021-03-10 17:48:28 817

原创 http常见状态码

http常见状态码2开头 (请求成功)表示成功处理了请求的状态代码。3开头 (请求被重定向)表示要完成请求,需要进一步操作。 通常,这些状态代码用来重定向。4开头 (请求错误)这些状态代码表示请求可能出错,妨碍了服务器的处理。5开头(服务器错误)这些状态代码表示服务器在尝试处理请求时发生内部错误。 这些错误可能是服务器本身的错误,而不是请求出错。301 Moved Permanently永久重定向。该状态码表示请求的资源已经被分配了新的URL,以后应该使用新的URL去访问该资源。302 Fou

2021-02-19 13:22:28 709

原创 nginx和apache的常见问题一

nginx的upstream容错机制是怎么样的?nginx默认判断失败节点状态以error错误和timeout超时状态为准,而不是以错 误状态码来判断,因为毕竟有状态码返回,证明这个节点还是可以正常连接的。 我们可以添加proxy_next_upstream指令设置对错误状态码的请求转到其他后 台处理,这样才会将这些状态码的请求视为失败节点状态。 如果所有的后台节点返回的都是错误状态码,那么就会返回给用户错误信息。 对单个后台节点来说,每返回一次错误状态码就会使这个节点的fails加一,当 fails的值

2021-02-15 19:57:49 160

原创 tomcat的优化

安全优化1首先禁用欢迎界面和管理界面 。删除tomcat的webapps目录下所有文件和目录2. 修改默认根目录路径3. 删除conf/tomcat-user.xml文件端口保护tomcat的shutdown端口,我们可以改成8000-9000之间不常用的端口号,然后 更改shutdown的执行命令,如下操作 关闭tomcat方式 [root@localhost conf]# telnet 127.0.0.1 8008 Trying 127.0.0.1… Connected to 127.0.0

2021-02-15 16:59:09 230 3

翻译 linux运维工程师日常工作事务

linux运维工程师日常都是什么工作?1.操作系统状态监控每天登陆系du统查zhi看系统运行的负dao荷如何,有无报错zhuan日志或报警日志。2.操作系统shu故障排除依据操作系统故障日志分析出现该报警或报错的原因,从而解决问题,保证操作系统的高可用性。3.服务器状态确认服务器上除了跑着操作系统,必然会安装一些应用程序或数据库,运维工程师每天需要查看linux系统上运行着的应用程序或数据库状态是否正常。4.备份运维工程师的看家本事,数据库备份和恢复,一般来说只要给数据库制定了备份策略它会自

2021-02-13 20:43:43 1363

原创 ceph

CephCeph是一种软件定义存储,可以运行在几乎所有主流的Linux发行版(比如CentOS和Ubuntu)和其它类UNIX操作系统(典型如FreeBSD)。Ceph的分布式基因使其可以轻易管理成百上千个节点、PB级及以上存储容量的大规模集群,同时基于计算的扁平寻址设计使得Ceph客户端可以直接和服务端的任意节点通信,从而避免因为存在访问热点而导致性能瓶颈。Ceph是一个统一存储系统,即支持传统的块、文件存储协议,例如SAN和NAS;也支持对象存储协议,例如S3和Swift。Ceph引入了一个叫C

2021-02-13 20:34:11 429

翻译 linux常见报错种类

说起来日常的故障,其实,首先应该相到的就是:“备份”。毕竟再怎么牢固的系统或硬件都会有故障的时候,所以,备份放第一位。作为linux运维,多多少少会碰见这样那样的问题或故障,从中总结经验,查找问题,汇总并分析故障的原因,这是一个Linux运维工程师良好的习惯。每一次技术的突破,都经历着苦闷,伴随着快乐,可我们还是执着的继续努力,从中也积累了更多的经验,这就是实践给予我们的丰厚回报。常见问题解决集锦1.shell脚本不执行问题:某天研发某同事找我说帮他看看他写的shell脚本,死活不执行,报错。我看

2021-02-12 22:41:51 2546

翻译 报错——1.常见报错注释

1.command not found 命令没有找到2.No such file or directory 没有这个文件或目录3.Permission denied 权限不足4.No space left on device 磁盘没有剩余空间5.File exists 文件已经存在6.Is a directory 这是1个目录7.Not a directory 不是1个目录8.Warning: Changing a readonly file 警告:改变一个只读文件9.Found a swa

2021-02-12 09:49:04 158

原创 Ansible应用3

NSD AUTOMATION DAY03案例1:ansible应用案例案例2:加密敏感数据案例3:Ansible Roles1 案例1:ansible应用案例1.1 问题本案例要求掌握Ansible更多高级语法知识,具体要求如下:熟悉firewalld和template模块的使用熟悉error处理机制熟悉handlers任务熟悉when条件判断熟悉block任务块熟悉loop循环的使用方法1.2 步骤实现此案例需要按照如下步骤进行。步骤一:firewalld模块使用firew

2021-02-08 11:15:18 183

原创 部署Ansible

1 案例1:部署Ansible1.1 问题本案例要求先快速搭建好一个Ansible平台,并测试环境,要求如下:创建实验主机(控制端和被控制端)配置SSH实验环境安装Ansible自动化软件修改Ansible配置1.2 方案准备如表-1所示的实验环境,操作系统为RHEL8,配置主机名称、IP地址、YUM源。ansible原理:控制端主机自带很多模块(模块就是脚本);ansible通过ssh远程被管理主机,将控制端的模块(脚本)或命令传输到被管理主机;在被管理端主机执行模块(脚本)或命

2021-02-07 22:24:14 358

原创 clusterrole访问权限

什么是RBACRBAC全称Role-Based Access Control,是Kubernetes集群基于角色的访问控制,实现授权决策,允许通过Kubernetes API动态配置策略。什么是RoleRole是一组权限的集合,例如Role可以包含列出Pod权限及列出Deployment权限,Role用于给某个NameSpace中的资源进行鉴权。通过YAML资源定义清单创建Role什么是ClusterRoleClusterRole是一组权限的集合,但与Role不同的是,ClusterRole可以

2021-01-16 10:57:23 1746

原创 Bootstrap Token 方式增加 Node

TLS Bootstraping(证书的引导)在kubernetes集群中,Node上组件kubelet和kube-proxy都需要与kube-apiserver进行通信,为了增加传输安全性,采用https方式。这就涉及到Node组件需要具备kube-apiserver用的证书颁发机构(CA)签发客户端证书,当规模较大时,这种客户端证书颁发需要大量工作,同样也会增加集群扩展复杂度。为了简化流程,Kubernetes引入了TLS bootstraping机制来自动颁发客户端证书,所以强烈建议在Nod

2021-01-14 16:34:01 647

原创 Kubernetes 网络

Service存在的意义Pod与Service的关系Service三种类型Service代理模式Service DNS名称Ingress为弥补NodePort不足而生Pod与Ingress的关系Ingress ControllerIngressService 存在的意义• 防止Pod失联(服务发现)• 定义一组Pod的访问策略(负载均衡)Pod与Service的关系• 通过label-selector相关联• 通过Service实现Pod的负载均衡( TCP/UDP 4层).

2021-01-13 14:54:04 81

原创 kubernetes ——网络存储nfs

kubernetes ——网络存储nfs一:共享的机器上安装nfs1.yum -y insstall nfs-utils2.mkdir -p /etc/exports3.vi /etc/exports/ifs/kubernetes *(rw,no_root_squash)共享哪个目录 谁可以访问?什么权限?以什么身份4.systemctl restart nfs二:在需要链接共享服务的机器上(k8s-master)mount -t nfs 192.168.1.32:/ifs/k

2021-01-11 10:33:11 179 1

原创 nginx+keepalived

基本概念+nginx+keepalived什么是jre?Java运行环境(Java Runtime Environment,简称JRE)的一个软件,JRE的内部有一个Java虚拟机(Java Virtual Machine,JVM)以及一些标准的类别函数库(Class Library)。包含Java虚拟机,Java核心类库,支持文件但是不包含开发工具JDK,调试器,和其他工具。什么是jdk?jdk(Java Development Kit),从字面意思翻译过来就是java开发的工具。可以这样理解

2021-01-05 18:03:44 127

原创 2021-01-05

运维技术原理1.tomcat是用来干嘛的,你所知道的和tomcat类似的软件有哪些?tomcat是一种web容器,一个免费开源的Servlet/JSP容器。它是Apache基金会 的Jakarta项目中的一个核心项目,由Apache,Sun和其它一些公司及个人共同开发而成。作用是管理servlet应用的生命周期,把客户端请求的url映射到对应的servlet,与servelet合作处理http请求。它能解释jsp和Java。类似的软件还有有jetty、jboss、weblogic、resin等等

2021-01-05 14:54:34 428 1

翻译 2021-01-04

二:基本常用Linux crontab 命令参数说明:-e : 执行文字编辑器来设定时程表,内定的文字编辑器是 VI-r : 删除目前的时程表-l : 列出目前的时程表 (分 时 日 月 周)| | | | || | | | ±---- 星期中星期几 (0 - 7) (星期天 为0)| | | ±--------- 月份 (1 - 12)| | ±--

2021-01-04 18:38:57 56

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除