问题记录 MLNX_OFED_LINUX-5.4-3.6.8.1-ubuntu20.04-x86_64安装mlnx-ofed-kernel-dkms错误

root@zju-PowerEdge-R540:/home/zju/Downloads/MLNX_OFED_LINUX-5.4-3.6.8.1-ubuntu20.04-x86_64# ./mlnxofedinstall --upstream-libs --dpdk
Logs dir: /tmp/MLNX_OFED_LINUX.1892101.logs
General log file: /tmp/MLNX_OFED_LINUX.1892101.logs/general.log

Below is the list of MLNX_OFED_LINUX packages that you have chosen
(some may have been added by the installer due to package dependencies):

ofed-scripts
mstflint
mlnx-tools
mlnx-ofed-kernel-utils
mlnx-ofed-kernel-dkms
rdma-core
libibverbs1
ibverbs-utils
ibverbs-providers
libibverbs-dev
librdmacm1
rdmacm-utils
librdmacm-dev
libibumad3
ibacm
python3-pyverbs

This program will install the MLNX_OFED_LINUX package on your machine.
Note that all other Mellanox, OEM, OFED, RDMA or Distribution IB packages will be removed.
Those packages are removed due to conflicts with MLNX_OFED_LINUX, do not reinstall them.

Do you want to continue? [Y/n] y
Setting up mlnx-ofed-kernel-dkms (5.4-OFED.5.4.3.6.8.1) …
Removing old mlnx-ofed-kernel-5.4 DKMS files…


Deleting module version: 5.4
completely from the DKMS tree.

Done.
Loading new mlnx-ofed-kernel-5.4 DKMS files…
First Installation: checking all kernels…
Building only for 5.15.0-83-generic
Building for architecture x86_64
Building initial module for 5.15.0-83-generic

Reading package lists… Done
Building dependency tree
Reading state information… Done
mlnx-ofed-kernel-dkms is already the newest version (5.4-OFED.5.4.3.6.8.1).
0 upgraded, 0 newly installed, 0 to remove and 31 not upgraded.
1 not fully installed or removed.
After this operation, 0 B of additional disk space will be used.
Do you want to continue? [Y/n] y
Setting up mlnx-ofed-kernel-dkms (5.4-OFED.5.4.3.6.8.1) …
Removing old mlnx-ofed-kernel-5.4 DKMS files…


Deleting module version: 5.4
completely from the DKMS tree.

Done.
Loading new mlnx-ofed-kernel-5.4 DKMS files…
First Installation: checking all kernels…
Building only for 5.15.0-83-generic
Building for architecture x86_64
Building initial module for 5.15.0-83-generic
Error! Bad return status for module build on kernel: 5.15.0-83-generic (x86_64)
Consult /var/lib/dkms/mlnx-ofed-kernel/5.4/build/make.log for more information.
dpkg: error processing package mlnx-ofed-kernel-dkms (–configure):
installed mlnx-ofed-kernel-dkms package post-installation script subprocess returned error exit status 10
Errors were encountered while processing:
mlnx-ofed-kernel-dkms
E: Sub-process /usr/bin/dpkg returned an error code (1)
W: Operation was interrupted before it could finish

同时近期该机器出现了某个存储卷失效的问题,不知道是何原因

本来想安装rdma的组件,参考https://blog.csdn.net/ibless/article/details/121663751 ,
输入了sudo ./mlnxofedinstall --add-kernel-support这一步之后报错
之后发现dpdk的收包功能失效,出现了以下错误
EAL: Detected 32 lcore(s)
EAL: Detected 2 NUMA nodes
EAL: Multi-process socket /var/run/dpdk/rte/mp_socket
EAL: Selected IOVA mode ‘PA’
EAL: No free hugepages reported in hugepages-1048576kB
EAL: No free hugepages reported in hugepages-1048576kB
EAL: No available hugepages reported in hugepages-1048576kB
EAL: Probing VFIO support…
EAL: VFIO support initialized
EAL: using IOMMU type 8 (No-IOMMU)
EAL: Probe PCI driver: net_ice (8086:1592) device: 0000:af:00.0 (socket 1)
ice_load_pkg_type(): Active package is: 1.3.30.0, ICE OS Default Package
ice_init_proto_xtr(): Protocol extraction is not supported
EAL: Probe PCI driver: net_ice (8086:1592) device: 0000:af:00.1 (socket 1)
ice_load_pkg_type(): Active package is: 1.3.30.0, ICE OS Default Package
ice_init_proto_xtr(): Protocol extraction is not supported
EAL: No legacy callbacks, legacy socket not created
EAL: Error - exiting with code: 1

之后尝试按照该方法安装MLNX就出错了

MLNX版本下载,直接wget

https://content.mellanox.com/ofed/MLNX_OFED-5.4-3.6.8.1/MLNX_OFED_LINUX-5.4-3.6.8.1-ubuntu20.04-x86_64.tgz

然后解压缩,安装

/home/zju/Downloads/MLNX_OFED_LINUX-5.4-3.6.8.1-ubuntu20.04-x86_64

tar -xvzf

sudo ./mlnxofedinstall --dpdk

然后按照他输出的提示restart

/etc/init.d/openibd restart

该问题待解决,可能可以参考https://forums.developer.nvidia.com/t/failed-to-install-mlnx-ofed-kernel-dkms-deb-with-version-4-9-4-1-7-0/205889
或者这个
https://forums.developer.nvidia.com/t/i-failed-to-build-mlnx-ofed-linux-for-5-4-0-70-generic/206147

更新,安装5.8版本已解决:

去NVIDA官网看一下,选择另一个合适的版本
https://network.nvidia.com/products/infiniband-drivers/linux/mlnx_ofed/
我是ubuntu20.04系统,所以
下载wget https://content.mellanox.com/ofed/MLNX_OFED-5.8-3.0.7.0/MLNX_OFED_LINUX-5.8-3.0.7.0-ubuntu20.04-x86_64.tgz,并解压
5.8新版本的驱动
然后对老版本5.4目录下运行在这里插入图片描述

然后在5.8目录下运行
./mlnxofedinstall --add-kernel-support
在这里插入图片描述

发现失败
然后再运行 ./mlnxofedinstall --dpdk
在这里插入图片描述
在这里插入图片描述

成功
然后运行/etc/init.d/openibd restart
失败,原因如下:
在这里插入图片描述

rmmod: ERROR: Module ib_uverbs is in use by: irdma

意思就是,内核模块 ib_uverbs被irama使用,所以可以参考
https://blog.csdn.net/qq_32949893/article/details/108402550

运行 sudo modprobe -r irdma ib_uverbs,然后再运行/etc/init.d/openibd restart,就可以了,如图所示

在这里插入图片描述
安装完成

<think>好的,我现在需要帮用户在Ubuntu安装Mellanox OFED驱动。首先,我得回想一下之前了解的相关步骤。记得用户提供的引用链接里有官方的驱动下载页面,可能需要先下载合适的驱动版本。 首先,用户使用的是Ubuntu系统,所以需要确认系统版本和内核版本是否与驱动兼容。Mellanox的驱动通常要求特定的内核版本,如果系统内核更新过,可能需要安装对应的头文件和开发包,比如linux-headers和dkms。这一步很重要,否则在安装过程中可能会出现编译错误。 接下来,用户需要从官方网站下载驱动包。根据引用中的链接,用户应该访问Mellanox的网站,选择对应的Linux驱动版本。这里要注意选择与Ubuntu版本匹配的驱动,比如Ubuntu 20.04或22.04。下载完成后,解压文件,进入目录执行安装脚本。通常的命令是运行mlnxofedinstall,但可能需要root权限,所以记得使用sudo。 然后,安装过程中可能会遇到依赖问题。常见的依赖包括perl、python、gcc等,这些需要提前安装好。如果安装脚本报错缺少依赖,用户需要根据提示逐一安装。另外,安装完成后需要重启服务,比如opensm,并配置驱动加载到内核模块中,可能需要运行modprobe命令。 还有一个需要注意的点是,安装完成后建议重新启动系统,确保驱动正确加载。此外,用户可能需要配置网络接口,使用ibstat命令检查InfiniBand设备的状态,确认驱动是否生效。 如果用户遇到问题,比如驱动无法编译或加载,可能需要检查日志文件,通常位于/var/log/mlnx_install.log。此外,查看系统日志如dmesg也可能有帮助。如果内核版本太新,可能需要手动安装特定版本的linux-headers,或者等待Mellanox更新驱动支持。 总结下来,步骤大致是:确认系统兼容性,下载驱动,安装依赖,执行安装脚本,配置驱动,验证安装。过程中需要处理可能出现的依赖错误和内核兼容性问题,确保每一步都正确执行。</think>### 在 Ubuntu 系统中安装 Mellanox OFED 驱动程序的步骤 #### 1. **确认系统兼容性** - 检查 Ubuntu 系统版本和内核版本: ```bash lsb_release -a uname -r ``` Mellanox OFED 驱动对特定内核版本有要求,需与官网文档匹配[^1]。 #### 2. **下载驱动** - 访问 [Mellanox OFED 驱动下载页面](https://network.nvidia.com/products/infiniband-drivers/linux/mlnx_ofed/),选择与系统匹配的版本(如 `Ubuntu 22.04`)[^2]。 - 使用 `wget` 下载或手动上传到服务器。 #### 3. **安装依赖** - 安装基础编译工具和内核头文件: ```bash sudo apt update sudo apt install gcc make perl dkms linux-headers-$(uname -r) ``` #### 4. **解压并安装驱动** - 解压下载的驱动包(以 `MLNX_OFED_LINUX-5.8-3.0.7.0-ubuntu22.04-x86_64.tgz` 为例): ```bash tar -xvf MLNX_OFED_LINUX-*.tgz cd MLNX_OFED_LINUX-* ``` - 执行安装脚本(需 root 权限): ```bash sudo ./mlnxofedinstall --auto-add-kernel-support ``` #### 5. **配置驱动并重启服务** - 加载内核模块并重启服务: ```bash sudo /etc/init.d/openibd restart sudo modprobe ib_umad ``` #### 6. **验证安装** - 检查 InfiniBand 设备状态: ```bash ibstat ibstatus ``` - 如果显示 HCA 卡信息(如 `mlx5_0`),则驱动安装成功。 #### 7. **处理常见问题** - **依赖错误**:根据脚本提示安装缺失的包(如 `libelf-dev`)。 - **内核不兼容**:若安装失败,尝试指定 `--kernel` 参数或升级系统内核。 - **日志分析**:查看 `/var/log/mlnx_install.log` 定位具体错误
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值