记一次proxmox故障修复

简短版

主机pci设备变动,导致网卡名称由原来的enp2s0变更成为了enp1s0。

vmbr0是通过网卡名称创建的桥接,因此通过该网卡名称的桥接失效了。

解决方法:

修改/etc/network/interfaces。将网卡名称修改为正确的即可。

完整过程

proxmox安装时,主机有板载网卡和pci网卡两张网卡,有一块通过pci转接板安装的nvme固态硬盘,安装完成后过了一段时间开启了核显直通,除第一次安装外,主机一直没有通过连接显示器登陆过

问题出现在,将主机的pci网卡和pci转接的nvme固态硬盘取出后,板载网卡灯也不亮了,无法远程登录主机了。于是,打算连接显示器查看,系统启动后显示器输出磁盘检查信息后就没有任何输出了。(一开始以为pci设备变动会导致内核错误,系统启动不起来,把核显直通的事情给忘了。我应该相信debian的坚强程度的,不会因为一点硬件变动就启动不起来,泪。。)

于是,修改grub启动参数,去掉quiet指令,查看详细启动日志,并用日志作为关键词查了很久没有找到原因,自认为没有能力修复这种级别的问题,准备备份数据重新安装。

用ubuntu live启动挂载pve系统盘后,由于不太了解lvm机制,除了能挂载pve/root和pve中创建的容器系统盘外,其他虚拟机配置、磁盘镜像都找不到。已经凌晨了,一度绝望。。。想着放弃所有数据重装得了。。

万幸,想到了核显直通的事情,试着修改了grub启动参数,关掉直通模块,重新启动后发现,并不是我想象中的系统无法启动。系统启动正常,只是没有网络。挨个排查resolve.conf、interfaces等配置文件,才发现pci设备的变动导致网卡名称变了,interfaces文件中pve桥接的还是旧的网卡名称,修改后就正常了。

本次排查错误过程中忽略了重要的信息,导致问题判断错误,大部分时间浪费在这里,真正解决问题的时间不到10分钟。今日添加pcie设备又遇到同样问题,竟然忘记了之前教训,又排查半天,特此记录,也分享给有遇到类似问题的朋友参考。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值