目录
2. 使用 socket 接口时,如何正确工作在非阻塞模式下?
1. 为什么UDP接收或发送会丢包?
- 用户态应用程序在接收 UDP 数据时(单播或组播报文),同时进行其它有延时的操作(如写码流数据到 USB 存储设备),应该程序将延迟接收 UDP 数据包,而 socket 默认接收缓存只有108544Byte,这样可能会使 socket 接收缓存满,无法接收新的 UDP 数据包,出现丢包现象。可在内核下通过执行下面命令进行确认:
cat /proc/net/snmp | grep Udp
如果 RcvbufErrors 字段增加较多,说明确实是 socket 接收缓存满导致的丢包。以下命令可以增加接收缓冲区大小(设置为 20,000,000 字节 (即 20 MB)),解决以上问题。
echo 20000000 > /proc/sys/net/core/rmem_max echo 20000000 > /proc/sys/net/core/rmem_default echo 20000000 > /proc/sys/net/core/netdev_max_backlog
这样做的目的是提高网络传输性能,特别是在处理大量数据流时。这种改动,需要根据实际码流发送速度和接收程序的延时进行参数调优。
- UDP 发送可能会丢包,一种原因是 CPU 发送 UDP 报文的速率超过了网卡 MAC 的发包速率,导致网卡MAC的发送缓冲队列满,引起了丢包。可以在内核下通过执行下面命令进行确认:
ifconfig eth0
如果打印的信息中 TX dropped 和 overruns 值基本相等,都增加较多,说明是网络MAC的发送缓冲队列满导致的丢包。以下命令可以减小发送缓冲区,让CPU发包速率慢一点,解决以上问题。
echo 20000 > /proc/sys/net/core/wmem_max echo 20000 > /proc/sys/net/core/wmem_default
这种改动,需要根据码流发送速率和丢包率的要求进行参数调优。
2. 使用 socket 接口时,如何正确工作在非阻塞模式下?
在网络编程中对于一个网络句柄会遇到阻塞IO 和非阻塞IO 的概念, 这里对于这两种 socket 先做一下说明:
阻塞IO:socket 的阻塞模式意味着必须要做完IO 操作(包括错误)才会返回。
非阻塞IO:非阻塞模式下无论操作是否完成都会立刻返回,需要通过其他方式来判断具体操作是否成功。
对于一个 socket 是阻塞模式还是非阻塞模式有两种方式来处理:
- 方法1:fcntl 设置;用 F_GETFL 获取 flags,用 F_SETFL 设置 flags | O_NONBLOCK; fcntl 函数可以将一个 socket 句柄设置成非阻塞模式:
flags = fcntl(sockfd, F_GETFL, 0); //获取文件的flags值 fcntl(sockfd, F_SETFL, flags | O_NONBLOCK); //设置成非阻塞模式
设置之后每次对于 sockfd 的操作都是非阻塞的。
flags = fcntl(sockfd, F_GETFL, 0); //获取文件的flags值 fcntl(sockfd, F_SETFL, flags & ~O_NONBLOCK); //设置成阻塞模式
设置之后每次对于sockfd 的操作都是阻塞的。
- 方法2:recv、send 系列的参数 (读取、发送时,临时将 sockfd 或 filefd 设置为非阻塞)。 recv、send 函数的最后有一个 flag 参数可以设置成 MSG_DONTWAIT,临时将 sockfd 设置为非阻塞模式,而无论原有是阻塞还是非阻塞。
recv(sockfd, buff, buff_size, MSG_DONTWAIT); //非阻塞模式的消息发送 send(scokfd, buff, buff_size, MSG_DONTWAIT); //非阻塞模式的消息接受
3. TOE 使能及使用注意事项
TOE 模块(TCP Offload Engine,TCP 卸载引擎) 同时实现两个网络接口数据的接收和发送,可以工作在 10/100/1000Mbit/s 模式下,支持半双工和全双工工作模式,提供 MII、RMII 和 RGMII 接口。TOE 模块能够通过硬件部分实现 TCP/IP 加速处理的功能,不但能够提升网络接口的吞吐量,还可以显著的降低 CPU 占用率。
- Hi3536 网口默认使用的是 bypass 功能,使能 TOE 功能只需要如下操作即可:
修改文件系统的 /etc/init.d/S81toe 启动脚本:
将 insmod /hitoe/stmmac.ko 注释掉;
再将下列三句话使能,打开 TOE 功能:
echo 8192 > /proc/sys/vm/min_free_kbytes echo 200 > /proc/sys/vm/vfs_cache_pressure insmod /hitoe/stmmac.ko hitoe=1
由于这里保留空间增大了,相应的 bootargs 中 MEM 的配置也要相应的增大,否则会出现内存不够用的情况。
- Hi3536 GMAC 每次使用 TOE 发送数据时,需要大块连续的物理内存,但是内核中大块连续内存的数量非常少。因此在使用前需要做如下处理,确保能够分配到足够多的物理内存。下述处理只是简单的举例,具体的数值需要根据业务场景使用的连接数来决定。
echo 8192 > /proc/sys/vm/min_free_kbytes echo 200 > /proc/sys/vm/vfs_cache_pressure
min_free_kbytes 表示最小保留内存的大小,缺省值为 8192,vfs_cache_pressure 表示设置了虚拟内存回收 directory 和 i-node 缓冲的倾向,缺省值为 100,推荐设置为 200,因为该参数的值越大,回收的倾向越严重。这样 TOE 就会有更多的物理内存使用。Hi3536 ETH 使用时如果网口出现内存分配不足的情况下可以在 shell 下进行如下设置(增大最小保留内存):
echo 16384 > /proc/sys/vm/min_free_kbyte
- TOE 不支持选择性重传功能,而内核默认打开了网络模块的选择性重传,为了 Hi3536 在 TOE 模式下能与对端设备协商一致,需要关闭选择性重传:
echo 0 > /proc/sys/net/ipv4/tcp_sack
- TOE 接收描述子个数可以配置,默认 4096,消耗 8MB 内存(每个描述子 2K)。补充说明:个数可以根据内存大小或应用场景配置。CPU 压力越大,网络压力越大,则配置描述子大可以提高性能,其他情况下可以减少配置,一般简单场景 256 即可,可以节省内存,配置范围 256~8192。配置方法举例:
insmod stmmac.ko hitoe=1 tnk_rx_fifo=4096
- 增加 socket 选项,可以通过 setsocketopt 来实现某个 socket 是否使用 TOE 功能,目前默认每个 socket 都使能 TOE。实现方法:在具体的业务 socket 层代码中定义如下宏:
#define SO_TOE_ENABLE 76
在创建 socket 连接的代码实现中添加 TOE 使能开关:
int val = 0; /* DISABLE TOE : val = 0 ENABLE TOE: val = 1*/ int len = sizeof(int); setsockopt(sockfd, SOL_SOCKET, SO_TOE_ENABLE, &val, len);
-
增加 socket 选项,可以通过 getsockopt 来获取某个 socket 是否处于 tcp 连接加速状态。实现方法:在具体的业务 socket 层代码中定义如下宏:
#define SO_TOE_STATE 77
当用户创建并使用 socket 后,用户可以通过如下代码在任意时刻获取 tcp 连接的加速状态:
int val; int len = sizeof(int); getsockopt(sockfd, SOL_SOCKET, SO_TOE_STATE, &val, &len);
如果返回的 val 值为 1,说明 tcp 连接处于加速状态,如果返回的 val 值为 0,说明 tcp 连接处于非加速状态。
- 增加对所有连接默认是否开启 TOE 加速的支持。如果用户希望默认所有连接不开启 TOE 加速,仅当主动通过 setsockopt 设置某条连接开启 TOE 时,这条连接才开启 TOE 加速特性,那么用户可通过内核文件系统 /proc 下的参数来进行设置。其中,/proc/sys/tnk/tnk_tcp_gmac0_enable 是网口 0 口的 TOE 使能开关,/proc/sys/tnk/tnk_tcp_gmac1_enable 是网口 1 口的 TOE 使能开关,向该 proc 节点写 1 表示所有连接默认开启 TOE 加速,写 0 表示所有连接默认不开启 TOE 加速。如果用户希望网口 0 默认所有连接不开启 TOE 加速,使用命令如下:
echo 0 >/proc/sys/tnk/tnk_tcp_gmac0_enable
这样,网口 0 所有连接默认都不会开启 TOE 加速,客户可以通过 setsockopt 来使能某条 socket 进入 TOE 加速。
4. TOE 模式下使用 socket 接口时的注意事项
- 在 TOE 模式下,不管是阻塞模式还是非阻塞模式,协议处理是由硬件完成的,当出现内核 buffer满时,都会给上层应用返回 EAGAIN,而在 Bypass 模式下,如果是阻塞模式,则出现内核 buffer 满时,不会返回 EAGAIN,而阻塞继续发送!
- 另外经过查询得知 send 的返回值是这样处理的:阻塞模式与非阻塞模式下,send 返回值 < 0 && (errno == EINTR || errno == EWOULDBLOCK || errno == EAGAIN) 表示暂时发送失败,需要重试,如果 send 返回值 <= 0, && errno != EINTR && errno != EWOULDBLOCK && errno != EAGAIN 时,连接异常,才需要关闭。
- 因此,建议应用程序在调用 send 时,若返回值 < 0 && (errno == EINTR || errno == EWOULDBLOCK || errno == EAGAIN) 应该延时等待一段时间再重新尝试发送,而不要直接调用 close 断开连接,则不会出现此问题。