Linux
文章平均质量分 88
运维个西瓜
这个作者很懒,什么都没留下…
展开
-
关于KVM虚拟化网桥bridge的一个mac/port映射表故障分析
最近在公司的一台生产服务器上遇到个kvm虚拟化服务的网络故障。故障的主要现象就是虚机网络通信异常,丢包严重。系统和软件包版本信息是:从抓包结果来看,在从虚拟化的宿主物理机上ping虚机时,可以看到一个很有意思的现象:当虚机网络开始丢包时,那些被弄丢的数据包实际上是发给了物理机的网卡。物理机网卡em1和虚机对应的tap网卡vnet0同时接入到了网桥br0中。网桥br0相当于是物理机本地的一个软件交换机,处理虚拟化网络的数据包通信转发工作。...原创 2022-06-04 10:57:32 · 1530 阅读 · 0 评论 -
基础设施即代码工具Terraform的一些典型使用场景
Terraform是什么HashiCorp Terraform 是一种基础架构即代码工具,可让您在可读的配置文件中定义云和本地资源,您可以对其进行版本控制、重用和共享。 然后,您可以使用一致的工作流程在整个生命周期内配置和管理所有基础架构。 Terraform 可以管理计算、存储和网络资源等低级组件,以及 DNS 条目和 SaaS 功能等高级组件。Terraform 通过其应用程序编程接口 (API) 在云平台和其他服务上创建和管理资源。Providers组件使 Terraform 能够通过可访问的 A原创 2022-02-18 18:35:52 · 2477 阅读 · 0 评论 -
XFS:kmem_alloc中可能的内存分配死锁
今天一台生产环境在使用的业务虚机忽然故障了,现象是系统中的所有应用程序都不能正常的写磁盘,但是诡异的是系统的磁盘I/O是的跑满了的。根据系统日志中的一些错误信息,我查找到了下面这篇由一位德国的云平台工程师撰写的技术分析文章。经过对照错误信息后,发现是一致的问题,我们参考这篇文章并有效解决了设备的故障事件,恢复了业务服务。有感于这位德国的工程师在研究问题时的一种敬业和执着,不断深入挖掘的精神,也很佩服他分析问题的方法和思路,故花了一点时间将其翻译为中文,希望更多人受益。这里所谈的受益完全不仅仅是怎样解决类翻译 2021-02-20 19:49:19 · 3330 阅读 · 0 评论 -
使用git管理puppet运行环境与配置版本
一、Puppet运行环境在运维工作中需要同时处理开发、测试和生产等多套运行环境时,可以使用Puppet的环境配置选项{environment},并结合指定自定义的变量配置。修改puppet.conf增加环境的配置Puppet默认是以生产环境运行的(即main),可以按需进行重新定义一种或几种运行环境。在配置环境变量时,还可以自定义site.pp的位置、模块目录能原创 2015-11-22 00:05:19 · 1774 阅读 · 0 评论 -
使用puppet控制客户端主机创建文件以及安装指定软件包
一、在Master上配置一个puppet测试节点的管理信息Master节点主机名为mytest1Client节点主机名为mytest2在主节点上执行:mkdir -p /etc/puppet/modules/test/{manifests,templates,files} --创建必要的目录,manifests中存放模块的主配置文件init.pp。如果使用到原创 2015-11-14 17:33:09 · 846 阅读 · 0 评论 -
【Puppet in action】 学习笔记之Puppet目录结构及配置文件说明
1、管理命令:servicepuppetmaster start --启动puppet serverpuppet agent --server mytest1 --test --客户端发起验证puppet cert --list --查看等待验证的主机puppet cert sign mytest2 --签署主机mytest2的验证请求puppet cer原创 2015-11-05 01:10:11 · 2342 阅读 · 0 评论 -
关于Redis sentinel哨兵高可用选举master的几个技术细节知识问与答
Redis Sentinel应用Raft协议来解决分布式系统一致性问题,即选举redis master的问题。我们在使用redis哨兵架构时,经常强调哨兵节点数量需要设置为3或5或7。假定哨兵节点数量为N,那么quorum票数就设置为N/2+1 。实际的业务情况有很多变化,部署规模也不等,在设计Redis哨兵高可用架构时如果没留意其中的一些细节,很容易进坑。所以我结合实际工作经验设计出下面这样一...原创 2019-11-25 19:24:16 · 1678 阅读 · 0 评论 -
Heartbeat HA高可用软件的一些使用技巧以及资源管理超时问题的分析
文章目录heartbeat之集群组件新、旧CRM资源管理器节点和首选节点角色(node and prefered node)切换heartbeat服务的几种操作方法关于Heartbeat资源管理超时时间的一个问题分析heartbeat之集群组件Heartbeat 从3.x开始,架构拆分为heartbeat、pacemaker(资源管理器)、cluster-glue(集群黏合器)几个相互独立的软...原创 2019-08-28 00:28:32 · 1742 阅读 · 0 评论 -
Centos 7系统firewalld防火墙常用配置方法参考
Firewalld是Linux下的新一代系统防火墙管理工具,相比于旧有的iptables工具,提供了更多的管理功能,像基于zones管理访问授权,动态加载规则等。不过很多高级功能我们日常并不会有机会使用到。所以,在这里我们并不讨论firewalld原理上的东西。工作中经常遇到的情况是配置基于端口、服务的各种访问授权与放行规则。本文提供一些这些方面的常用配置方法,以供参考。常规配置方法端口放行限...原创 2019-04-26 14:39:15 · 988 阅读 · 0 评论 -
怎样使用Vagrant在几分钟里搭建出一套多节点的虚机测试环境
我们使用到的越来越多的工具或软件是多节点分布式部署形式的,或者是C/S部署形式。无论哪一种,仅创建和启动一个虚机时,连基本的安装部署也完成不了,也不要说进一步做什么模拟测试了。而Vagrant可以帮助我们极大提高多节点的测试环境搭建效率,让你在几分钟内就运行起一套多节点的满足测试需求的主机和网络环境。我们使用Vagrant来管理自己的模拟测试环境的另一个理由是:Vagrant让我们可以方便得分享测...原创 2018-06-25 00:42:01 · 1802 阅读 · 0 评论 -
使用netfilter/iptables时经常能在匹配规则中看到-m addrtype --dst-type这样的内容,何解
比方说我们使用docker容器,一定会在iptables的NAT表中看到下在这样的一条配置规则:-A PREROUTING -m addrtype --dst-type LOCAL -j DOCKER从整体上看,这条规则是要把符合什么匹配规则的数据包,在数据包进入NAT表PREROUTING链时,让它直接jump到一个名为DOCKER的链。至于在这个DOCKER的链中有哪些继续生效的NAT规则,不...原创 2018-05-15 11:46:35 · 9599 阅读 · 0 评论 -
跟我学Linux系列1:正确认识和使用一块RAID卡都需要掌握Linux服务器系统配件选型的哪些知识
1、存储器的层次结构知识我们从上往下说。操作系统中的存储器构成了一个金字塔,越往上的存储器速度越快,但是价格也越贵,所以也就越小。为了解决高速的处理器和低速的存储器之间的矛盾,上一层的存储器作为下一层存储器的缓存。(1)CPU缓存在现代的CPU(大多数)上,所有的内存访问都需要通过层层的缓存来进行。CPU的读/写(以及取指令)单元正常情况下甚至都不能直接访问内存——这是物理结构决定的;CPU都没有...原创 2018-04-27 09:00:27 · 3000 阅读 · 0 评论 -
记录一次Linux Firewalld防火墙故障排查的案例Error:Action org.fedoraproject.FirewallD1.config.info is not registered
1、故障现象在一个生产服务器上,系统为CentOS7.3,防火墙使用的是系统默认的firewalld。偶然发现,在执行以下防火墙管理命令时,报错如下:# firewall-cmd --list-allError: Action org.fedoraproject.FirewallD1.config.info is not registered虽然查看防火墙配置规则列表的命令报错了,但其它的规则配置...原创 2018-04-26 01:09:11 · 15241 阅读 · 9 评论 -
跟我学Linux系列2:Netfilter/iptables知多少
1、netfilter是什么netfilter.org是Linux 2.4.x及更高版本内核系列中包过滤框架软件。 通常与netfilter.org相关的软件是iptables。这个框架内的软件可以实现数据包过滤,网络地址和端口转换(NA [P] T)以及其他数据包转换。 它是以前的Linux 2.2.x ipchains和Linux 2.0.x ipfwadm系统的重新设计和大大改进的后续产品。...原创 2018-05-02 09:01:27 · 925 阅读 · 0 评论 -
Linux系统启动的知识
1、固件1.1 Legacy BIOS即传统的BIOS,使用16位编码,寻址能力因此受限。此BIOS下的设备驱动执行方式是使用中断向量和固定大小的中断服务空间,典型的一个中断服务只能使用128KB的空间,即驱动大小不能超过128KB。使用16位的汇编代码编写驱动。1.2 EFI BIOS由INTEL主推的新一代BIOS固件,使用C实现,寻址能力扩展到了32位,甚至64位。有以下特点:EFI BIO...原创 2018-02-17 00:03:23 · 580 阅读 · 0 评论 -
Linux安全基础知识
1、概览首先,Linux从UNIX和POSIX那里继承了最基本的安全机制:用户、文件权限和进程capabilities。其次,补充提供了一个通用的安全访问控制框架——Linux安全模块(LSM),是通过可加载的内核模块实现的,可以支持现存的各种不同的安全访问控制系统。SELinux、DTE、LIDS、AppArmor、SELinuxSmack、TOMOYO Linux、Openwall等都是通过L...原创 2018-04-15 20:11:18 · 4423 阅读 · 0 评论 -
Linux内核内存管理
1、内存模型概览通常CPU可见的地址是有限制的,32位的CPU最多可见4GB的物理空间,64位的CPU可见的空间会更大。32位的系统一般都需要考虑通过“动态映射”方法拓展物理内存的可见性问题。通常程序访问的地址都是虚拟地址,用32位操作系统来讲,访问的地址空间为4G,linux将4G分为两部分。如图1所示,其中0~3G为用户空间,3~4G为内核空间。通过MMU这两部分空间都可以访问到实际的物理内存...原创 2018-04-07 23:39:47 · 1829 阅读 · 0 评论