҉人间无事人
不要假装很努力,坚持下去,就会有收获。
展开
-
ntp服务端内网搭建和客户端简易使用方法、nova service-list状态为down处理方法、nova service-list服务状态大批量为down且down的主机在变化处理方法
如我们的openstack集群,controller01是ntp服务端,其他所有主机都同步controller01这个时间,集群几百台客户端,总不能一个个去安装ntp并配置和启用ntp服务把?其实这种问题最先想到的应该是rabbitmq出问题了,我也去看了日志和消息队列,发现都没啥问题【起码看起来没问题,但拥堵和出问题并不是一定有直接的关系】大概知道问题了,猜想是时间不同步造成的,给109这个宿主机添加定时任务和同步时间。添加了好几分钟时间还是没同步,就手动同步了以下,发现同步出问题了。原创 2023-11-01 11:58:02 · 153 阅读 · 0 评论 -
dashboard报错 错误:无法获取网络列表、dashboard报错 错误:无法获取云主机列表 解决流程
首先,dashboard上无论是管理员还是其他项目,均无法获取云主机和网络信息,具体报错如下。一直在弹出下面报错,可以看到也是和httpd有关,那么就去看httpd的报错日志。原创 2023-10-18 11:08:22 · 710 阅读 · 0 评论 -
冷迁移报错[错误:error creating snapshot nova-resize form...].处理方法【虽然迁移报错但主机名确实变了且虚拟无法开机】、迁移失败后删除生成的异常快照的流程
如我这,迁移前虚拟机再computer07上,迁移后,虽然报错了,但主机变成computer03了,所以实际上迁移动作已经有了,但是呢就是迁移被中止了而已。所以后来换了个思路,排查所有服务,发现目的主机上neutron服务有问题。后来解决了目的主机上的neutron服务,特么的,再次测试,恢复了。做了很多测试,且再源主机、目的主机、控制节点看了两天的日志,发现报错内容都极度相似,并没有捕获到什么重要且有用的信息。查看neutron服务,发现computer03的服务死了【只保留了几个】原创 2023-09-14 15:37:59 · 129 阅读 · 0 评论 -
openstack冷迁移失败以后虚拟机状态错误处理、openstack冷迁移失败后虚拟机回退流程、dashboard分离虚拟机接口没反应到底层删除该ip流程【底层删除ip】
dashboard界面冷迁移后,虚拟机都会报错,且状态会变为错误,但是之前主机在computer07上,虽然报错了,但主机确实已经迁移了,如下图,主机由computer07变成computer03。【就好像迁移了,但没完全迁移,迁移到一半报错就停止了这样】因为我有2个虚拟机测试,都是同样的情况,迁移后就报错,回退后,只有一台是正常的,还有一台始终报错【因为之前还做了蛮些操作,不知道动到啥了】,但回退流程就是上面的样子,照着做即可。回到底层查看状态,该虚拟机确实已经变成error了。原创 2023-09-12 18:18:33 · 184 阅读 · 0 评论 -
rabbitmq常用命令和mq配置文件、rabbitmq日志报错“no exchange ‘reply_处理流程、(404) NOT_FOUND - no queue处理流程、rabbitmq重置流、
=上面这个其实是rabbitmq常见的报错了。而且下面这个方法是万能的,遇到mq相关的问题,遇事不决直接重建即可。==重建有风险,可能会导致队列消息被抛弃有些请求无法接受,但你都准备重建了,说明是解决不了了,至于哪些请求呗丢弃了,也无所谓了是不是。显示RabbitMQ集群的集群状态。它提供了关于集群中的节点、它们的状态以及任何正在运行的应用程序的信息。启动应用【启动后成为单节点运行,等待加入集群,如果没有接入集群,需要停止后手动加入】我下面是已经处理完故障,正常的界面哈。原创 2023-09-08 17:00:04 · 365 阅读 · 0 评论 -
dashboard冷迁移没反应解决方法、openstack的nova用户设置免密流程【nova用户没密码,不能用命令定义】、Stderr: u‘Host key verification failed
流程和说明看上面标题: 开始解决nova用户无法免密的问题。原创 2023-09-06 12:51:41 · 112 阅读 · 0 评论 -
存储重启后,ceph挂载信息没了,手动定位osd序号并挂载到对应磁盘操作流程、ceph查看不到osd信息处理方法
因为挂载信息没有写到fstab里面,所以不会自动up,并且没有挂载信息,并且也看不到osd信息了,需要手动一一挂载后才能正常up和看到osd信息。我们的一个存储节点莫名其妙的重启了,不知道咋回事。但这样的问题就是,所有osd都down了。原创 2023-07-27 11:52:48 · 965 阅读 · 0 评论 -
openstack删除nova service-list中的computer服务列表流程
nova状态也可以在dashboard查看的 中文激活这栏就是nova服务了【激活表示服务已启动】,同理,关闭服务也可以在这执行【最右边操作中,关闭服务】开头,所以现在up的这个主机名错了,差个r。所以我先把compute02改为computer02并重启【因为重启以后nova服务会自动注册服务】一样的效果,enable表示为开启,disabled表示为关闭。我这以处理compute02为例。然后再查看nova状态。因为集群内其他主机名为。修改主机名为正确格式。原创 2023-04-07 11:00:31 · 506 阅读 · 0 评论 -
openstack替换ip、openstack底层现有ip替换其他ip
文章目录说明更改流程信息获取替换ip删除原网卡添加新网卡重启网卡【注意事项】【重启网卡报错处理】说明下面是在openstack的控制节点通过命令完成。通过命令行更改;通过命令行更改必须关闭虚拟机。更改流程信息获取假设,我现在有一台虚拟机的ip是1.1.99.53,需要换成1.1.99.126【这个ip必须没有使用才行】那么下面的值为1.1.99.53这台虚拟机的信息。下面命令均在控制节点执行,如果执行失败,先source环境变量1、neutron net-list【记录po原创 2022-02-24 17:40:08 · 2548 阅读 · 0 评论 -
dashboard疏散主机提示报错:无法疏散主机...处理方法、openstack虚拟机状态卡在重启处理方法、openstack在数据库修改虚拟机状态的方法
后面发现造成这个原因是因为该虚拟机所属的宿主机down机了。但是又因为上面虚拟机一直处于硬重启状态,所以这台虚拟机肯定是无法迁移或疏散出去的。所以疏散主机就会报下面错误咯。前提条件,有个虚拟机控制台刷不出来,以为虚拟机死机了,重启后发现一直卡在重启界面,并且host_status信息也获取不到了。疏散主机就提示,错误,无法疏散主机。原创 2023-03-08 18:14:41 · 669 阅读 · 0 评论 -
ceph暂停/恢复集群数据同步方法、ceph重建日志盘完整流程详细记录、sgdisk命令简单说明、启动osd命令的两种方法说明
生产环境上实操的,日志盘是raid1,一般情况下是不需要做重建日志盘操作的,但我们运气很不好,raid卡坏了,2个日志盘同时坏了都被我们遇到了,重建的次数还不少。所以玄学上来说,搞运维还是要去烧香拜佛的。现在可以查看的,现在journal_uuid中有信息,该内容为之前的分区uuid信息,肯定是不能用了的,所以我们全部都需要改。启动前,查看下状态,全是 not running【mon节点会自动up】如我这有10个osd要做,我就弄10个出来。大致参考了下面这个国外的方法。我这的ceph版本如下。原创 2023-03-31 21:51:28 · 458 阅读 · 0 评论