Intel网卡 E810-XXVDA2 E810-XXVDA4 E810-CQDA2 E810-2CQDA2 windows调优指南
X710-DA2 X710-DA4 X710-T4 Windows性能调优指南
810-2cqda2 window调优
e810window调优
3.0基准性能测量和调优方法
3.1一般性能调优方法
每次只关注一个调优更改,这样您就知道每个更改会产生什么影响对你的考验。您在调优过程中越有条理,就越容易做到识别并解决性能瓶颈的原因。
3.2网络性能基准
在开始任何调优练习之前,您应该有一个良好的基线测量你的网络性能。另外,除了对你的初步评估特定的应用程序/工作负载性能,应该使用标准网络性能微基准测试以验证网络设备是否处于良好状态。
为了测试25 Gbps或更高的接口速度,通常需要这样做多个通信线程使用该连接。Iperf2和iperf3提供了已知运行良好的常见微基准测试。
3.2.1 iperf2
英特尔建议在大多数基准测试情况下使用iperf2而不是iperf3,因为它们的易用性和对单个应用程序实例中多个线程的支持。英特尔对于25G连接,建议使用-P选项在2到4个线程中运行100G连接大约6到8个线程。
下载最新的iperf2 Windows binary: iperf2 Files
运行从客户端到服务器的单向流量:
1. 启动服务器。
iperf-2.1.9-win.exe -s -D
2. 开始客户端:
iperf-2.1.9-win.exe -c <serverIP> -P <threads>
运行从客户端到服务器的双向流量,反之亦然:
1. 启动服务器:
iperf-2.1.9-win.exe -s -D -p <port>
2. 开始客户端:
iperf-2.1.9-win.exe -c <serverIP> -p <port> -p <threads>——full-duplex或
iperf-2.1.9-win.exe -c <serverIP> -p <port> -p <threads
请注意:
iperf2中的——full-duplex和-d选项都允许执行双向操作测试。然而,全双工选项特别关注全双工测试。
3.2.2 iperf3
使用iperf3需要应用程序的多个实例来利用Receive侧缩放(RSS)、多线程和硬件队列。
使用iperf3与使用iperf2的不同之处如下:
•带有-P选项集的iperf3在单个I/O中使用多个流量流线程。
•iperf3支持单线程基准测试与多个流来自一个应用程序线程。
•带有-P选项集的iperf2为每个-P实例生成一个单独的线程。
•iperf2支持真正的多线程基准测试。
英特尔建议运行2到4个应用程序会话25G连接和100G连接大约6到8个会话。每个会话应该指定唯一的TCP使用-p选项的端口值。
•下载最新的iperf3 Windows二进制文件:
•https://iperf.fr/iperf-download.php窗户
运行从客户端到服务器的单向流量:
1. 启动服务器。
iperf3.exe - s
2. 启动客户端。
iperf3.exe -c <serverIP>
启动iperf3的多个实例(线程):
1. 使用for循环将线程映射到TCP端口。
2. 使用下面的命令在后台运行iperf3:
Start-Process
3. 启动服务器4个实例/线程:
for ($i = 0; $i -le 3; $i++) { Start-Process powershell.exe -ArgumentList "-Command", ".\iperf3.exe -s -p ((5200+$i))" }
4. 用4个实例/线程启动客户端:
for ($i = 0; $i -le 3; $i++) { Start-Process powershell.exe -ArgumentList "-Command", ".\iperf3.exe -s -p ((5200+$i))" }
请注意:
for循环在后台的端口上创建了四个iperf3服务器/客户端进程5200到5203。为每个进程创建一个新窗口。
关闭新窗口的创建,并将所有输出发送到活动窗口:
•将-NoNewWindow命令添加到Start-Process命令的末尾如下:
Start-Process powershell.exe -ArgumentList "-Command", ".\iperf3.exe -s -p ((5200+$i))" -NoNewWindow
Start-Process powershell.exe -ArgumentList "-Command", ".\iperf3.exe -c <serverIP> -p ((5200+$i))" -NoNewWindow
请注意
对于100G连接,增加For循环以创建6到8个实例/线程。
3.2.3微软NTTTCP
NTTTCP是NTTCP(网络吞吐量测试工具)的扩展版本。由微软开发。此工具用于测量两者之间的网络吞吐量
并允许用户评估网络性能指标,如带宽、延迟和丢包。
从官方Microsoft GitHub存储库https://github.com/下载该工microsoft/ntttcp或其他微软下载渠道。
1. 启动服务器:
ntttcp.exe -s -m ,<no-of-connections>,<mapping-type>,<local-ip> -t<duration> - p<port-number>
示例命令:
ntttcp.exe -s -m 8,1,192.168.11.22 -t 30 -p 7001
2. 开始客户端:
ntttcp.exe -r -m <no-of-connections>,<mapping-type>,<server-ip> -t <duration>- p <port-number >
示例命令:
ntttcp.exe -r -m 8,*,192.168.11.22 -t 30 -p 7001
其中*表示工具自动检测本地IP地址另一个端点。
4.0性能故障处理
4. 1收集服务器详细信息
4.1.1半导体存储器输出
收集测试配置中每个服务器的系统级详细信息。
1. 下载最新版本的SSU:
Intel®System Support Utility for Windows (SSU)
2. 在测试涉及的每个服务器上运行SSU.exe。SSU输出提供硬件、固件和驱动程序的完整系统目录的水平。这些细节对于帮助诊断和调试性能非常有用问题。任何与性能相关的支持票都可以在英特尔支持团队处打开需要这些信息。
请注意
SSU目前不收集PCIe详细信息。然而,这些信息可能是至关重要的用于诊断性能问题。
请注意
PCIe网卡必须安装在支持设备的PCIe插槽中功能。如果适配器安装在PCIe宽度/速度较低的PCIe插槽中功能超过设备所要求的,性能将受到很大影响。为例如,当E810适配器需要x16 PCIe插槽和x16 PCIe riser时,在x8安装或电连接时,性能会受到影响。按照ETL (Collect Event Trace Logs)用于单独收集PCIe详细信息。
请参考检查PCI Express (PCIe) Slot Capabilities收集PCIe详细信息分开。X710设备支持PCIe 5.0 x8连接最低PCIe 3.0 x8速度。E810设备支持PCIe 5.0 x16连接并且至少需要PCIe 3.0 x16速度(双端口25G时为x8)。
4.2收集事件跟踪日志
ETL (Event Trace Logs)是在Windows操作系统上通过PerfView工具生成的日志文件由微软提供。这些日志文件包括应用程序和系统级错误,警告和其他事件数据,可用于调试性能和定时问题。
收集ETL日志。
使用PerfView收集ETL跟踪
4.3检查驱动程序错误的系统日志
要检查Windows系统日志中的错误和警告,请使用以下方法之一方法:
•事件查看器
•PowerShell命令
使用事件查看器检查系统日志:
1. 使用Windows开始菜单的搜索功能打开事件查看器。
2. 打开应用程序。
3. 导航到Windows日志。
4. 导航到系统。
5. 对标题为“级别”的第一列进行排序,以列出位于的错误和警告消息
系统事件日志窗口的顶部。
6. 查找驱动程序(i40ea/i40eb/icea)的任何错误或警告项。
7. 查找可能与您的应用程序或应用程序相关的其他错误/警告
配置,例如:
•Hyper-V条目(如果您使用的是虚拟化环境)
•多主机网络拓扑的DNS Client事件
使用PowerShell命令查看系统日志。
1. 列出所有事件: