- 步骤一: 先看一下我用socket写的一个最简单服务器:
//文件名称: server.cpp
#include <stdio.h>
#include <unistd.h>
#include <stdlib.h>
#include <string.h>
#include <sys/socket.h>
#include <netinet/in.h>
#include <arpa/inet.h>
#include <iostream>
using namespace std;
int main(int argc, char *argv[])
{
unsigned short port =7865;
int socketid = socket(AF_INET, SOCK_STREAM, 0);
if (socketid<0)
{
perror("socket");
exit(-1);
}
struct sockaddr_in my_addr;
bzero(&my_addr, sizeof(my_addr));
my_addr.sin_family = AF_INET;
my_addr.sin_port = htons(port);
my_addr.sin_addr.s_addr = htonl(INADDR_ANY);
int err_log = bind(socketid, (struct sockaddr*)&my_addr, sizeof(my_addr));
if (err_log !=0 )
{
perror("binding");
close(socketid);
exit(-1);
}
err_log = listen(socketid, 20);
if(err_log != 0)
{
perror("listen");
close(socketid);
exit(-1);
}
struct sockaddr_in client_addr;
socklen_t socklen = sizeof(client_addr);
cout << "before accept!" <<endl;
int socketidnew = accept(socketid, (sockaddr*)&client_addr, &socklen);
cout << "after accept!" <<endl;
return 1;
}
放在linux上编译运行,显示如图:
image.png
-
步骤二: 在windows上telnet该服务器:
telnet前的命令.png
telnet后连接上,又迅速断开windows上的显示.png
server上的显示.png
-
步骤三:server执行结束后,10秒内再次启动server:
看到异常了吗?.png
“
binding: Address already in use
” ,为什么报这种错误?地址被占用?地址由 IP和端口 组成,在这里很容易想到是端口依然被占用着没有释放。
可明明服务器和客户端之间的连接已经断开 ,server进程已经退出了,怀疑是server里面socket没有正常关闭导致的,于是在server.cpp的main函数里加上这句:image.png
这样修改后,试了一下,问题依然没有解决。
- 步骤四:这时候使用netstat -pant 命令查看一下server端,linux上服务器的tcp连接情况:
image.png
可以发现 7865 端口依然被占用着,即不是 LISTEN 也不是 ESTAB-LISHED状态, 而是TIM_WAIT。
回忆TCP断开连接,四次挥手时的状态变迁:
主动断开方:ESTAB-LISHED 到 FIN-WAIT1 再到 FIN-WAIT2 再到 TIME-WAIT,最后到CLOSED。
被动断开方:ESTAB-LISHED 到 CLOSE-WAIT 再到 LAST-ACK 最后到CLOSED。
我的server进程在打印after accept!
这一字符串后,就退出而导致连接断开,所以server端是主动断开端,进入了TIME-WAIT状态,等待 2MSL 时间,才能进入CLOSED状态,方能重新使用7865
这个端口。(socketidnew 和 socketid 虽然在我们上层应用中关闭了,但是在 linux 内核的TCP/IP协议栈实现中并没有立即关闭。 )
等待几分钟后,我再次启动server,也确实可以正常运行,和理论上的一致。
“那么,如果我想在server像上面一样退出后,立即可以再次启动,那该怎么办呢?
”
问了下度娘,有人说在 bind 前加如以下一段代码可以解决,我试了一下,确实可以:
int opt = 1;
if (setsockopt(socketid, SOL_SOCKET, SO_REUSEADDR, &opt, sizeof(opt)) != 0)
{
perror("Server setsockopt failed");
return 1;
}
这段代码干了什么, 为什么端口可以立即重用?
setsockopt是对 ”与套节字有关的选项“ 进行设置。这里设置监听套节字为 SO_REUSEADDR 后重做上述实验,第二次启动后,在 windows 上 再次 telnet 一下。此时server退出,用netstat查看TCP连接状态,显示如图:
如果,端口7865上有两条连接,且这两条连接都处于TIME-WAIT状态
可看见同一个端口 (7865)同一个 IP 上存在两条连接,这两条连接都处在TIME_WAIT状态。而且这两条连接的的 PID(线程ID) 都是一条横线,神马情况?
我们从 sever.cpp 中可以看到,我们的 server 进程执行完后直接退出,所以两条连接所对应的进程实质上已经不存在,这两条连接在 TIME-WAIT 状态时,事实上是在内核中维护的。
可以看到设置SO_REUSEADDR之后,当一个端口对应的连接处于TIME-WAIT状态时,内核允许该端口被另一个server实例所启动。在本例中,相当于 7865 端口可以存在两条连接,一条处于TIME-WIAT状态,一条处于与客户端通讯的ESTAB-LISHED状态,只不过这里server立即关闭socket后退出了(实验中可以不关闭的),让后面的连接也是TIME-WAT状态。(这里我省略了关于侦听套节字的过程说明,因为侦听套节字和 accept 返回的那个与客户端通讯的套节字用的都是 7865 端口,而Listen状态的侦听套节字只要在server.cpp里close掉,在内核中就会立即销毁,SO_RESUSEADDR的设置对其不影响)。
但是既然 TCP/IP 协议栈设置了TIME-WAIT这个状态,又默认不允许在前一条连接的TIME-WAIT状态结束后,立即重用同一 端口创建连接,肯定是有原因的?设置SO_REUSEADDR就有风险,这个风险我分析就是,当与重启后的sever实例建立连接的客户端,它的IP、端口与原来的客户端IP、端口都一模一样时,重启后的server实例就有可能收到以前连接的消息。
最后用百度百科里的话对SO_REUSEADDR的作用做一上总结:
编写 TCP/SOCK_STREAM 服务程序时,SO_REUSEADDR到底什么意思?
a, 这个套接字选项通知内核,如果端口忙,但TCP状态位于 TIME_WAIT ,可以重用端口。
如果端口忙,而TCP状态位于其他状态,重用端口时依旧得到一个错误信息,指明"地址已
经使用中"。如果你的服务程序停止后想立即重启,而新套接字依旧使用同一端口,此时
SO_REUSEADDR 选项非常有用。必须意识到,此时任何非期望数据到达,都可能导致服
务程序反应混乱,不过这只是一种可能,事实上很不可能。
b, 一个套接字由相关五元组构成,协议、本地地址、本地端口、远程地址、远程端口。SO_REUSEADDR
仅仅表示可以重用本地地址、本地端口,整个相关五元组还是唯一确定的。所以,重启后的服务程序有
可能收到非期望数据。必须慎重使用 SO_REUSEADDR选项。