Linux性能优化----网络性能_rxpck txpck-CSDN博客

本文链接：https://blog.csdn.net/pengshengli/article/details/95339119

1.网络的数据转发流程

网络的本质跨计算机的进程通信，说是进程间的通信，其实数据交互的流程非常复杂。数据从机器A流向到机器B，首先从机器A的应用层到数据链路层，层层封装，然后数据再到网卡，从网卡发出，经过复杂的网络到达机器B，机器B和A正好是相反的操作，如下示意图：

这里要说明一下，当数据到达B网卡的时候，会通过DMA的方式（网卡直接从主内存之间读写它们的I/O数据，CPU不参与）把数据写进DMA环形队列，然后网卡通过中断的方式，让网卡驱动程序从DMA环形队列里读走数据，拷贝到sk_buff(内核数据接口)缓冲区，并通过软中断的方式通知内核有新的数据到了。接下来就是网络协议栈的事情了，首先从缓冲区取出数据，层层剥离、校验等操作，最终到达应用层。

2.网络性能指标

带宽：链路的最大传输速率，单位b/s（比特/秒）。
吞吐率：单位时间传输成功的数据量，单位b/s（比特/秒）或B/s（字节/秒）。
延时：一个网络请求包发出后到响应所需要的时间延迟。
PPS：Pocket Per Second（包/秒）的简写，网络以包为单位的传输速率。

除了以上的指标还有并发连接数、丢包率、重传率等指标。

3.查看网络工具

ifconfig/ip

ifconfig属于软件包net-tools，ip属于iproute2软件包，ip命令要比ifconfig更丰富。

peter@peter-virtual-machine:~$ ifconfig ens33
ens33     Link encap:以太网  硬件地址 00:0c:29:f0:0a:3c
          inet 地址:192.168.2.203  广播:192.168.2.255  掩码:255.255.255.0
          inet6 地址: fe80::1aa9:207a:f3fb:8837/64 Scope:Link
          UP BROADCAST RUNNING MULTICAST  MTU:1500  跃点数:1
          接收数据包:3438018 错误:0 丢弃:0 过载:0 帧数:0
          发送数据包:553380 错误:0 丢弃:0 过载:0 载波:0
          碰撞:0 发送队列长度:1000
          接收字节:626319762 (626.3 MB)  发送字节:65276146 (65.2 MB)

peter@peter-virtual-machine:~$ ip -s addr show dev ens33
2: ens33: <BROADCAST,MULTICAST,UP,LOWER_UP> mtu 1500 qdisc pfifo_fast state UP group default qlen 1000
    link/ether 00:0c:29:f0:0a:3c brd ff:ff:ff:ff:ff:ff
    inet 192.168.2.203/24 brd 192.168.2.255 scope global dynamic ens33
       valid_lft 58559sec preferred_lft 58559sec
    inet6 fe80::1aa9:207a:f3fb:8837/64 scope link
       valid_lft forever preferred_lft forever
    RX: bytes  packets  errors  dropped overrun mcast
    626323750  3438057  0       0       0       0
    TX: bytes  packets  errors  dropped carrier collsns
    65277074   553388   0       0       0       0

从上可以看到MTU，IP地址，物理地址，网络包的收发统计。这里要注意几个状态标识：

ifconfig里的RUNNING和ip的LOWER_UP表示网络是连通的，如果没有发现这个标识，说明网络断开。还有下面几个标识的详细解释：

errors：表示收发数据发生的错误包。
dropped：表示丢弃的数据包。
overrun：表示超限数据包。
carrier：表示发生 carrirer 错误的数据包数，比如双工模式不匹配、物理电缆出现问题等。
collsns：表示碰撞数据包数。

netstat/ss

netstat/ss
# -l 表示只显示监听套接字
# -n 表示显示数字地址和端口
# -p 表示进程信息
# -t 表示只显示TCP套接字

Recv-Q：表示套接字缓冲还没有被应用程序取走的字节数（即接收队列长度）。

Send-Q：表示还没有被远端主机确认的字节数（即发送队列长度）。

全栈统计：

netstat -s

sar

查看吞吐率和PPS

 sar -n DEV 1

rxpck/s 和 txpck/s 分别是接收和发送的 PPS，单位为包 / 秒。

rxkB/s 和 txkB/s 分别是接收和发送的吞吐量，单位是 KB/ 秒。

rxcmp/s 和 txcmp/s 分别是接收和发送的压缩数据包数，单位是包 / 秒。

%ifutil 是网络接口的使用率，即半双工模式下为 (rxkB/s+txkB/s)/Bandwidth，而全双工模式下为max(rxkB/s, txkB/s)/Bandwidth

ping

连通性和延时性的检测。

peter@peter-virtual-machine:~$ ping -c3 192.168.2.10
PING 192.168.2.10 (192.168.2.10) 56(84) bytes of data.
64 bytes from 192.168.2.10: icmp_seq=1 ttl=255 time=1.55 ms
64 bytes from 192.168.2.10: icmp_seq=2 ttl=255 time=0.780 ms
64 bytes from 192.168.2.10: icmp_seq=3 ttl=255 time=1.30 ms

-c3表示发送三次ICMP报文就结束。 time表示往返时延。

4.C10K和C10M问题

C10K问题是Dan Kegel 在 1999 年提出。即2GB内存和千兆网卡，单机怎么实现10000并发请求。

这个问题的主要瓶颈在I/O模型，为什么？假设每个连接使用一个线程去管理，那么就需要10000个线程，而线程的所需的资源在于线程的切换、调度占的内存。Linux可以通过下面命令查看线程的栈大小：