通过PXE给Dell R630服务器安装操作系统
前言
最近给两台Dell R630型号的服务器安装操作系统,装的是Redhat6.8版本的,
安装操作系统次数多了,准备一个U盘做成U启动啥都有了,只是由于每次安装的操作系统版本不同,每次需要重新的做U启动就比较麻烦,
这次环境中有个搭建好的PXE服务器,上面的源正好是Redhat6.8的,可以借助他来进行操作系统的安装,
我的想法是好的,不就是通过PXE启动来引导安装操作系统吗,事先我还在自己的环境中搭建了一个PXE服务来进行模拟,了解运行的流程,但是实际操作的时候才发现最大的难点不在PXE服务而是在使用的服务器上面,
从网卡的选择、网卡模式的设置,再到启动顺序的设置,最重要的就是获取DHCP,这一个过程可是让我多次怀疑自己的设置过程有问题,每次都是在网卡设置DHCP获取地址失败,多次失败之后我就开始怀疑自己了,但是每次检查配置都是成功的,配置也没有问题,就是网卡获取不到DHCP地址,悲剧啊!
其中我还认为是我在BIOS中有的配置没有做才导致网卡没有获取到DHCO地址的,还顺手把服务器的硬件官方文档搞到一份,仔细的看了一遍,这个过程可谓是满满的都是坑,满满的心酸泪。
PS:这里PXE服务是没有问题的,主要是服务器部分有问题。
一、服务器基础配置
这次的两台服务器是闲置很久的,内存都是没有的,硬盘也是需要自己添加的,
——》硬盘添加完之后是一个服务器两块SSD,每块是480 做成RAID 1,总量是446G,
——》内存的话是每台加了四根,一根32G,一共是128G的内存,
添加内存条没啥可说的,就是注意一点A1——》B1,A2——》B2,对应就好了,
二、服务器PXE配置
因为安装操作系统PXE服务器是已经配置好的,所以我们不需要管,现在就是准备要安装的两台服务器就好了,一开始我还觉得挺简单的,因为预先在自己的虚机上搭建了一个PXE服务器,然后又启动了一个虚机来进行安装操作系统是很顺利的,结果到了服务器上那就考虑的问题有点多了。
1、网卡设置为PXE启动
首先,你是用PXE来进行安装操作系统,服务器和PXE服务器之间是需要连接的,可以是通过交换机,也可以是直连,
注意,如果是通过交换机提供的二层网络来进行安装的话,你要保证整个网络中没有其他的DHCP服务,因为PXE进行安装引导的时候第一步就是获取IP地址,然后接着进行引导,如果你的服务器获取到了其他的DHCP服务提供的地址那么就无法使用PXE来引导安装系统了。
——》我是直接拿了根老长的网线,一端连在PXE服务器的板载口上,另一端连接在服务器上
接着将网卡设置为PXE启动,
重启服务器——》选择F2进入系统设置(system Setup)
![]](https://img-blog.csdnimg.cn/20201106104121954.png?x-oss-process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3FxXzQzMTUyMzQ0,size_16,color_FFFFFF,t_70#pic_center)
——》选择设备设置(Device Settings)
——》选择指定的板载口,我这里是port3
这里的话就看你的物理连线了,这个可以在服务器插线的时候进行查看,上面有很小的数字写了3/4数字,就是BIOS中表示的port 3 port 4,
注意,这里要慎重,你插了哪个网口就开启哪个网口,千万不要多!千万不要多!千万不要多!
说说我这里的思路,服务器板载口插网线的是有两个口的就是port 3和4,所以我一开始是将两个端口的PXE都是打开的,我的想法是万一一个获取不到地址那就使用另外一个,省的我再进入配置,省事。
但是在获取的时候,插到port3的时候没有获取到,尝试了五次,没有获取到DHCP地址的时候,接着我换到了port4上面试了五次还是没有获取到,这就让我很慌张了,我都准备两个小时完事的,这都一个小时了第一台服务还没获取到地址,这就妹的慌张了。
这期间我是很多次进入BIOS中查看是不是配置出问题了,每次都是没查出来什么不同的地方,烦躁!
最后实在没辙了呼叫大佬支援,大佬来了之后查看了网卡配置之后,将其他没有插线的网卡都设置为none,然后在重启,第二次的时候就获取到DHCP地址,然后就进入了系统的引导界面了。心态爆炸,垃圾服务器!
——》接着选择NIC Configuration修改网卡的模式
——》最后这里设置为PXE模式就好。
现在网卡就设置完成了,接下来我们去看下启动顺序,可以将刚才修改的网卡往上提一提,
其实在重启服务的时候我们可以选择F11 Dell Lifecycle Controller里面我们可以指定引导的方式,我们在哪里也可以指定port3网卡来进行启动
2、设置启动顺序
按Esc返回到系统设置主菜单(System Setup Main Menu),
——》选择系统BIOS(System BIOS)
——》选择引导设置(Boot Settings)
这里我们可以看到引导设置详细信息
1、引导模式(Boot Mode),服务器默认是BIOS的,不需要动!
PS:这里的模式选择和你要安装的操作系统有关,如果你的操作系统支持UEFI那么你就可以选择使用UEFI模式,但是Centos6.8的操作系统支持的是BIOS所以我们这里就不需要动了。
2、重试引导顺序(Boot Sequence Retry),这里设置的还是BIOS,不需要动!
3、硬盘故障转移(Hard-Disk Failover),指定在硬盘驱动器发生故障的情况下进行引导的硬盘驱动器。这里系统默认选择的disabled关闭,不用管!
4、引导选项设置(BIOS Boot Settings),配置引导顺序和引导设备,
——》选择引导选项设置(BIOS Boot Settings)回车进入操作。
到这就可以很明显的看出来了,在我们系统的引导顺序是怎么样的,
1、Boot Sequence中设置引导项的先后顺序,通过加减号;
2、在Boot Option Enable/Disable中设置引导设置是否开启,
——》选择Boot Sequence,通过加号和减号来选择启动项是上移还是下降,
我们将port3移动到最上面,接着将C:硬盘启动设置到第二个位置,
注意,这样就可以了!这样就可以了!这样就可以了!别做多余的事情,
这就是最终的效果图,这样就可以了。
PS:我在重启服务器的某些时候遇到一种情况,
就是服务器启动之后通过port3端口DHCP没有获取到地址,接着引导到了C盘的时候一直卡在哪里了,我等了有五分钟还是没有过去,我还尝试重启服务器还是到了C盘的时候还是过不去了,
那么你就重启服务器按F2进入BIOS设置,然后到我们到我们调整引导项顺序的页面上面,在Boot Option Enable/Disable选项中将Hard driver C:前面的对号去掉,在再服务器就可以解决。
3、*重启服务器
现在我们网卡的PXE配置成功了,引导顺序也指定了,现在就是重启服务器然后网卡DHCP获取地址然后引导安装操作系统了,
重启服务器之后,这里我们可以看到四个选项,
1、F2 System Setup 进入系统配置,就是进入BIOS,设置RAID和启动项都是F2进入;
2、F10 Lifecycle controller 这是一个引导界面,就是预先设置好的一个配置项,也可以用来做RAID,效果和进入BIOS设置是相同的,但是对于不熟悉的同学来说通过F10来配置BIOS还是很友好的;
下面这两个选项可以帮助我们进行启动引导的选择,
3、F11 引导管理器(Boot Manager)我们可以指定使用port3来一直引导,一直DHCP获取IP地址;
4、F12 PXE引导(PXE Boot),系统将扫描并显示出主动联网系统,也就是说你网卡开启了PXE,这里都会扫描出来,如果有多个网卡开启了PXE,那么就会挨个的发起DHCP请求来获取地址,这就是我为什么只开启了一个网卡的PXE;
——》这里你选择F11和F12都可以,我选择F11
如果是选择F11 引导管理器的话可以看到下面的界面
1、Continue Normal Boot(持续正常引导) ,系统(设备)尝试从引导顺序中的第一项开始引导至设备。如果引导尝试失败,系统(设备)将继续从引导顺序中的下一项进行引导,直到引导成功或者找不到引导选项为止。
2、One-Shot Boot Menu(一次性引导菜单) ,通过该菜单项可访问引导菜单,然后可以选择要从中引导的一次性引导设备。
3、Launch System Setup(启动系统设置),允许您访问系统设置程序。
4、Launch Lifecycle Controller(启动 Lifecycle Controller),退出 Boot Manager(引导管理器),并启动 Lifecycle Controller 程序。
5、System Utilities(系统公用程序),通过该菜单项可以启动系统公用程序菜单,例如系统诊断和 UEFI shell。
——》这里我选择的第二项One-Shot Boot Menu(一次性引导菜单),
PS:F11引导管理器的第一项Continue Normal Boot(持续正常引导)可以实现持续的使用一个网卡来进行DHCP,我们只需要在启动引导顺序的时候将其他的都关闭掉只留一个port3来启动的话,就可以持续的使用一个来获取DHCP地址了。
选择One-Shot Boot Menu(一次性引导菜单)之后就可以看到下面的页面了,
——》这里我们选择port3来进行引导,
回车之后就开始引导系统了,现在是port3在进行DHCP地址的获取,
现在是网卡DHCP第一次失败了,然后使用硬盘启动、DVD启动等等方式,
这个是正常的状态,第一次肯定会失败,我这还是直连,这个我怀疑和DHCP服务有关系,
DHCP服务的工作过程中下发地址到服务器是有个交互的过程的,
1、正常的过程是server发请求说:“谁能给我一个IP地址啊!”
2、DHCP服务收到之后回复说:“我这里有一个IP地址可以使用,你要不要试试!”
3、server在收到回包之后,将数据包中带的地址配置在本地,能够配置上没啥子冲突,就回复DHCP服务:“好的,这个地址我进行使用了!”
4、DHCP服务收到之后,会在本地进行记录,这个地址已经被使用,并且记录租期等信息
这是DHCP的一个简单的交互过程,但是在服务器通过port3网卡获取IP地址的时候,他第一次的肯定失败的,但是你要是马上接着第二次也是用port3网卡来进行引导,立刻获取到IP地址了,
这就让我判断,第一次server发出请求,然后DHCP收到之后回包,然后server收到之后要确认了,也许是这个过程在server上花费的时间太多了,导致DHCP的连接没有完整的建立,结果第一次DHCP获取地址就失败了。
但是如果还是使用port3来获取IP,并且立刻开始第二次获取到地址,那么就把第一次获取地址的流程补充完整了,这时候你就完整的走过了DHCP服务的通信流程了,这样你的IP地址就获取好地址了,然后tftp发送内核、引导文件等操作之后,你就可以看到安装系统的引导界面了。
接着你会看下面的选项,
1、F1 继续并重试引导顺序,
2、F2 系统设置,就是进入BIOS进行设置,
3、F10 Dell Lifecycle Controller (LC) 提供高级嵌入式系统管理功能,包括系统部署、配置、更新、维护和诊断。LC 作为 iDRAC 带外解 决方案和 Dell EMC 系统 嵌入式统一可扩展固件接口 (UEFI) 应用程序的一部分提供。
4、F11 引导管理器
——》我们选择F1,正常情况下,就会进入到PXE的引导安装系统的界面了,
三、安装操作系统
这里的话就是获取到页面之后进行操作系统的安装了,因为是Centos6.8版本的操作系统,网上一大把,我也是百度到一个使用的,过程大致相同却别在于某些参数的描述是否详细了。
我这里的话就是说些我安装过程中比较关注的几个点,
下面这个界面就是我们DHCP获取到地址之后看到的引导界面了,
——》我这里默认第一个就可以了,
这里选择安装介质的时候要选择URL,然后这里填写在PXE服务器上面部署的FTP的地址,
这个是设置上网卡的,他前面一个操作是选择网卡,我使用的是port3那么就是第三个网卡,
注意,这里吧ipv6的选项去掉,否则的话会失败。
这是选择分区,最下面就是自己划分
我这里的规划就是100G给根目录,然后剩下的给home目录,
PS:这里是我截图时候的问题,第一个给了10G,剩下的都给了home,熟悉界面,别纠结参数!
这里的话就是boot引导写入那个分区,
最后就是安装软件了,安装完成后reboot重启下就好了,
四、基础部署
操作系统安装完成之后还是需要做些基础的操作的,比如IP地址的配置,ssh的设置,selinux和防火墙,还有用户名和密码的设置。
1、ssh服务
ssh服务的话就是开启允许root访问,因为我没有创建普通用户的习惯,
看配置文件中的设置默认是开启root访问的,但是不确定,那么将配置文件解除注释看下,
2、selinux和iptables
接着就是selinux,这个服务是一个比较麻烦的东西,他出发点是为了安全而设置的但是使用之后发现他麻烦了,所以我习惯性是将其关闭,
因为他是属于系统安全部分的不能像服务直接关闭,所以只能通过命令来让其暂时失效,然后在修改配置文件进行重启之后就可以关闭这个服务了,
修改配置文件设置为——》disabled开机自动关闭
因为是Redhat6.8的系统就是RHEL 6系列的操作系统使用的启动方式是SYSV的,不能使用system就比较让我尴尬,这里记录下命令就好,
# chkconfig iptables on
# chkconfig iptables off
# chkconfig --list | grep iptable
这是修改之后查询的效果,
3、修改IP地址
因为服务器使用的是40GE的网卡,按照正常流程操作系统是无法识别出来的,需要我再手动安装了驱动程序之后才能识别并且进行IP地址的配置,
但是意外的是他已经被识别出来了,这就舒服了,不用手动的安装驱动程序了,
接着通过修改配置文件的方式,
# vim /etc/sysconfig/network-scripts/ifcfg-p2p1
——》将状态从DHCP设置为static;
——》然后将onboot开机启动从no——》yes;
——》然后手动添加IP、掩码、网关就好了,
然后出去重启下network服务,查看IP地址是否配置上去?查看路由状态,网关是否存在?
# service network restart
# ip addr show
# route -n
最后还可以查看下网卡的状态,
# ethtool -i p2p1
五、总结:
通过PXE安装操作系统,工作完成之后感觉被服务器坑了,本来就是很简单两个小时就能搞定的事情,因为不熟悉、没有做过这些操作,搞了两天才完成,中间各种问题,各种怀疑自己,各种百度,还是没解决,还好大佬在,要是只有我一个人那就完蛋了!
整个过程完成之后还是很有收获的,比如DHCP获取不到地址的时候,怀疑是不是BIOS中关于网卡的配置没有配置全,有些内容没有配置,还把Dell 服务器关于BIOS描述的官方文档搞了一份,主要看了下第六章操作的部分,现在终于连接到进入BIOS的各个界面是叫啥了,也是一大收获。
总体来说,这次机会还是不错的,又让自己明白了,眼高手低是要不得的,实践出真知!