UNIX网络编程——基本TCP套接字编程

一、基于TCP协议的网络程序

下图是基于TCP协议的客户端/服务器程序的一般流程:

服务器调用socket()、bind()、listen()完成初始化后,调用accept()阻塞等待,处于监听端口的状态,客户端调用socket()初始化后,调用connect()发出SYN段并阻塞等待服务器应答,服务器应答一个SYN-ACK段,客户端收到后从connect()返回,同时应答一个ACK段,服务器收到后从accept()返回。


数据传输的过程:

建立连接后,TCP协议提供全双工的通信服务,但是一般的客户端/服务器程序的流程是由客户端主动发起请求,服务器被动处理请求,一问一答的方式。因此,服务器从accept()返回后立刻调用read(),读socket就像读管道一样,如果没有数据到达就阻塞等待,这时客户端调用write()发送请求给服务器,服务器收到后从read()返回,对客户端的请求进行处理,在此期间客户端调用read()阻塞等待服务器的应答,服务器调用write()将处理结果发回给客户端,再次调用read()阻塞等待下一条请求,客户端收到后从read()返回,发送下一条请求,如此循环下去。


如果客户端没有更多的请求了,就调用close()关闭连接,就像写端关闭的管道一样,服务器的read()返回0,这样服务器就知道客户端关闭了连接,也调用close()关闭连接。注意,任何一方调用close()后,连接的两个传输方向都关闭,不能再发送数据了。如果一方调用shutdown()则连接处于半关闭状态,仍可接收对方发来的数据。


在学习socket API时要注意应用程序和TCP协议层是如何交互的:

*应用程序调用某个socket函数时TCP协议层完成什么动作,比如调用connect()会发出SYN段

*应用程序如何知道TCP协议层的状态变化,比如从某个阻塞的socket函数返回就表明TCP协议收到了某些段,再比如read()返回0就表明收到了FIN段

补充一下,其实TCP 共有11种状态,上图没有出现的CLOSING 状态,当双方同时关闭连接时会出现此状态,替换掉FIN_WAIT2状态。

二、基本socket函数

1、socket函数

包含头文件<sys/socket.h>
功能:创建一个套接字用于通信

原型:

   int socket(int domain, int type, int protocol);  

参数
domain :指定通信协议族(protocol family),AF_INET、AF_INET6、AF_UNIX等
type:指定socket类型,流式套接字SOCK_STREAM,数据报套接字SOCK_DGRAM,原始套接字SOCK_RAW
protocol :协议类型,IPPROTO_TCP等;一般由前两个参数就决定了协议类型,设置为0即可。
返回值:成功返回非负整数, 它与文件描述符类似,我们把它称为套接口描述字,简称套接字。失败返回-1


2、bind函数

包含头文件<sys/socket.h>
功能:绑定一个本地地址到套接字
原型:

   int bind(int sockfd, const struct sockaddr *addr, socklen_t addrlen);  

参数
sockfd:socket函数返回的套接字

addr:要绑定的地址
addrlen:地址长度
返回值:成功返回0,失败返回-1

    如果一个TCP客户或者服务器未曾调用bind捆绑一个端口,当调用connect或listen时,内核就要为相应的套接字选择一个临时端口。让内核来选择临时端口对于TCP客户来说是正常的,除非应该需要一个预留端口然而对于TCP服务器来说却极为罕见,因为服务器是通过它们的众所周知端口被大家认识的。
    调用bind可以指定IP地址或端口,可以两者都指定,也可以都不指定。


    如果指定端口号为0,那么内核就在bind被调用时选择一个临时端口。然而如果指定IP地址为通配地址,那么内核将等到套接字已连接(TCP)或已在套接字上发出数据报(UDP)时才选择一个本地IP地址。
    对于IPv4来说,统配地址由常值INADDR_ANY来指定,其值一般为0.

   struct sockaddr_in servaddr;  
   servaddr.sin_addr.s_addr = htonl(INADDR_ANY);  

    其实无论是网络字节序还是主机字节序,INADDR_ANY的值(为0)都是一样的,因此使用htonl并非必需。
    为了得到内核选择的临时端口值,必须调用函数getsockname来返回协议地址。
    从bind函数返回的一个常见错误时EADDRINUSE(“Address already in use",地址已使用),后面的博客会讨论SO_REUSEADDR和SO_REUSEPORT这两个套接字选项。
    注意:端口号必须不小于1024,除非该进程具有相应的特权(即为超级用户)。


3、listen函数

包含头文件<sys/socket.h>
功能:将套接字用于监听进入的连接
原型:

  1. int listen(int sockfd, int backlog);  

参数
sockfd:socket函数返回的套接字
backlog:规定内核为此套接字排队的最大连接个数

返回值:成功返回0,失败返回-1

    一般来说,listen函数应该在调用socket和bind函数之后,调用函数accept之前调用。

    listen函数把一个未连接的套接字转换成一个被动套接字,指示内核应接受指向该套接字的连接请求,调用listen导致套接字从CLOSE状态转换到LISTEN状态。

    为了理解其中的backlog参数,对于给定的监听套接字,内核要维护两个队列:

  • 未完成连接队列:已由客户发出并到达服务器,服务器正在等待完成相应的TCP三路握手过程

  • 已完成连接的队列:每个已完成TCP三次握手过程的客户。

如下图所示:

    服务器处于listen状态时收到客户端syn 分节(connect)时在未完成队列中创建一个新的条目,然后用三路握手的第二个分节即服务器的syn 响应及对客户端syn的ack,此条目在第三个分节到达前(客户端对服务器syn的ack)一直保留在未完成连接队列中,如果三路握手完成,该条目将从未完成连接队列搬到已完成连接队列尾部。当进程调用accept时,从已完成队列中的头部取出一个条目给进程,当已完成队列为空时进程将睡眠,直到有条目在已完成连接队列中才唤醒。
    backlog被规定为两个队列总和的最大值,大多数实现默认值为5。
    一旦队列满,系统会拒绝多余连接请求,所以backlog的值应该基于服务器期望负载和接受连接请求与启动服务的处理能力来选择。
    当客户端发起connect而导致发送syn分节给服务器端握手,如果这时两个队列都是满的,tcp就忽略此分节,并且不发RST,这将导致客户端TCP重发SYN(超时),服务器端忽略syn而不发RST响应的原因是如果发RST ,客户端connect将立即返回错误,强制客户端进程处理这种情况,而不是让tcp的正常重传机制来处理。实际上所有源自Berkeley的实现都是忽略新的SYN分节。
    还有,backlog为0 时在linux上表明允许不受限制的连接数,这是一个缺陷,因为它可能会导致SYN Flooding(拒绝服务型攻击)。
    linux 系统tcp /ip协议栈有个选项可以设置未链接队列大小:tcp_max_syn_backlog

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值