在高并发连接服务器编写时,当同一秒内大量连接进入,epoll_wait的et总是丢失一部分连接,经上网查询后要求对每次accept都需要循环检查,添加代码后少量连接没有问题,连接数量上100就又会丢失一部分连接,无论是et模式还是lt模式都有这种情况。
今天偶然觉得可能会是accept的问题,纯accept循环仍然丢失连接,wireshark抓包没有问题,都收到了确认,服务器客户端都没有报错苦思不知原因,怀疑是listen问题,偶然发现我的连接方法其实就是syn泛洪攻击,发现listen是有一个队列的,并且队列本身还有长度,遂修改参数命令如下:
sysctl -w net.ipv4.tcp_max_syn_backlog=n
listen函数的参数也一并修改
1000路并发连接一路没丢,超过一千路发现报错errno=24,解决方法修改文件描述符数量即可。
路数上升到2000路也没有问题,上升到四千路时发生错误,同时客户端报错,没办法,我的电脑极限到了,需要两台电脑才能更大压力的进行测试。
关于客户端,我利用go的模拟线程来模拟高并发连接,1 c socket循环模拟说到底就是队列连接,不属于并发。2 c多线程占用资源太大,不能模拟。3 boost的异步连接说到底也是串行。基于以上原因选择go更能模拟出真实的大量连接问题。
以下为我的客户端代码(服务器代码网上很多,就不粘了):
package main
import (
"bufio"
"fmt"
"net"
)
func test() {
conn, err := net.Dial("tcp", "192.168.1.117:6002")
if err != nil {
panic(err)
}
data, err := bufio.NewReader(conn).ReadString('\n')
fmt.Printf("1\n")
if err != nil {
panic(err)
}
fmt.Printf("%#v\n", data)
}
func main() {
for i := 0; i < 3000; i++ {
go test()
}
var j int
fmt.Scanf("%d", &j)
fmt.Printf("fsdf\n")
}