Socket编程原理

1、问题的引入

    1) 普通的I/O操作过程:

     UNIX系统的I/O命令集,是从Maltics和早期系统中的命令演变出来的,其模式为打开一读/写一关闭(open-write-read-close)。在一个用户进程进行I/O操作时,它首先调用“打开”获得对指定文件或设备的使用权,并返回称为文件描述符的整型数,以描述用户在打开的文件或设备上进行I/O操作的进程。然后这个用户进程多次调用“读/写”以传输数据。当所有的传输操作完成后,用户进程关闭调用,通知操作系统已经完成了对某对象的使用。 

2) TCP/IP协议被集成到UNIX内核中

TCP/IP协议被集成到UNIX内核中时,相当于在UNIX系统引入了一种新型的I/O操作。UNIX用户进程与网络协议的交互作用比用户进程与传统的I/O设备相互作用复杂得多。首先,进行网络操作的两个进程在不同机器上,如何建立它们之间的联系?其次,网络协议存在多种,如何建立一种通用机制以支持多种协议?这些都是网络应用编程界面所要解决的问题。 

3) 需要一种通用的网络编程接口:  独立于具体协议和通用的网络编程

在UNIX系统中,网络应用编程界面有两类:UNIX BSD的套接字(socket)和UNIX System V的TLI。由于Sun公司采用了支持TCP/IP的UNIX BSD操作系统,使TCP/IP的应用有更大的发展,其网络应用编程界面──套接字(socket)在网络软件中被广泛应用,至今已引进微机操作系统DOS和Windows系统中,成为开发网络应用软件的强有力工具,本章将要详细讨论这个问题。 

2、SOCKET编程基本概念

  开始使用套接字编程之前,首先必须建立以下概念。 

 

2.1 网间进程通信  

进程通信的概念最初来源于单机系统。由于每个进程都在自己的地址范围内运行,为保证两个相互通信的进程之间既互不干扰又协调一致工作,操作系统为进程通信提供了相应设施,

如UNIX BSD有:管道(pipe)、命名管道(named pipe)软中断信号(signal)

UNIX system V有:消息(message)、共享存储区(shared memory)和信号量(semaphore)等.

他们都仅限于用在本机进程之间通信。网间进程通信要解决的是不同主机进程间的相互通信问题(可把同机进程通信看作是其中的特例)。为此,首先要解决的是网间进程标识问题。同一主机上,不同进程可用进程号(process ID)唯一标识。但在网络环境下,各主机独立分配的进程号不能唯一标识该进程。例如,主机A赋于某进程号5,在B机中也可以存在5号进程,因此,“5号进程”这句话就没有意义了。 其次,操作系统支持的网络协议众多,不同协议的工作方式不同,地址格式也不同。因此,网间进程通信还要解决多重协议的识别问题。 为了解决上述问题,TCP/IP协议引入了下列几个概念。 

 

1)端口 

网络中可以被命名和寻址的通信端口,是操作系统可分配的一种资源。 

按照OSI七层协议的描述,传输层与网络层在功能上的最大区别传输层提供进程通信能力。从这个意义上讲,网络通信的最终地址就不仅仅是主机地址了,还包括可以描述进程的某种标识符。为此,TCP/IP协议提出了协议端口(protocolport,简称端口)的概念,用于标识通信的进程。 

端口是一种抽象的软件结构(包括一些数据结构和I/O缓冲区)。应用程序(即进程)通过系统调用与某端口建立连接(binding)后,传输层传给该端口的数据都被相应进程所接收,相应进程发给传输层的数据都通过该端口输出。在TCP/IP协议的实现中,对端口的操作类似于一般的I/O操作,进程获取一个端口,相当于获取本地唯一的I/O文件,可以用一般的读写原语访问之。 类似于文件描述符,每个端口都拥有一个叫端口号(port number)的整数型标识符,用于区别不同端口。

由于TCP/IP传输层的两个协议TCP和UDP是完全独立的两个软件模块,因此各自的端口号也相互独立,如TCP有一个255号端口,UDP也可以有一个255号端口,二者并不冲突。 

端口号的分配是一个重要问题。有两种基本分配方式:

第一种叫全局分配,这是一种集中控制方式,由一个公认的中央机构根据用户需要进行统一分配,并将结果公布于众。

第二种是本地分配又称动态连接,即进程需要访问传输层服务时,向本地操作系统提出申请,操作系统返回一个本地唯一的端口号,进程再通过合适的系统调用将自己与该端口号联系起来(绑扎)。

TCP/IP端口号的分配中综合了上述两种方式。TCP/IP将端口号分为两部分,少量的作为保留端口,以全局方式分配给服务进程。因此,每一个标准服务器都拥有一个全局公认的端口(即周知口,well-known port),即使在不同的机器上,其端口号也相同。剩余的为自由端口,以本地方式进行分配。TCP和UDP均规定,小于256的端口号才能作保留端口。 

 

2)地址 

网络通信中通信的两个进程分别在不同的机器上。在互连网络中,两台机器可能位于不同的网络,这些网络通过网络互连设备(网关,网桥,路由器等)连接。因此需要三级寻址: 

1. 某一主机可与多个网络相连,必须指定一特定网络地址; 

2. 网络上每一台主机应有其唯一的地址; 

3. 每一主机上的每一进程应有在该主机上的唯一标识符。 

通常主机地址由网络ID和主机ID组成,在TCP/IP协议中用32位整数值表示;TCP和UDP均使用16位端口号标识用户进程。 

 

3)网络字节顺序 

不同的计算机存放多字节值的顺序不同,有的机器在起始地址存放低位字节(小端序),有的存高位字节(大端序)。为保证数据的正确性,在网络协议中须指定网络字节顺序。TCP/IP协议使用16位整数和32位整数的高价先存格式,它们均含在协议头文件中。

 

4)连接 

两个进程间的通信链路称为连接。连接在内部表现为一些缓冲区和一组协议机制。 

5)半相关 

综上所述,网络中用一个三元组可以在全局唯一标志一个进程: 

协议,本地地址,本地端口号) 这样一个三元组,叫做一个半相关(half-association),它指定连接的每半部分。 6)全相关 

一个完整的网间进程通信需要由两个进程组成,并且只能使用同一种高层协议。也就是说,不可能通信的一端用TCP协议,而另一端用UDP协议。因此一个完整的网间通信需要一个五元组来标识: 

协议,本地地址,本地端口号,远地地址,远地端口号) 这样一个五元组,叫做一个相关(association),即两个协议相同的半相关才能组合成一个合适的相关,或完全指定组成一连接。 

 

2.2 服务方式  

在网络分层结构中,各层之间是严格单向依赖的,各层次的分工和协作集中体现在不同层之间的界面上。“服务”是描述不同层之间关系的抽象概念,即网络中各层向紧邻上层提供的一组操作。下层是服务提供者,上层是请求服务的用户。服务的表现形式是原语(primitive),如系统调用或库函数。系统调用是操作系统内核向网络应用程序或高层协议提供的服务原语。网络中的n层总要向n+1层提供比n-1层更完备的服务,否则n层就没有存在的价值。 在OSI的术语中,网络层及其以下各层又称为通信子网,只提供点到点通信,没有程序或进程的概念。而传输层实现的是“端到端”通信,引进网间进程通信概念,同时也要解决差错控制,流量控制,数据排序(报文排序),连接管理等问题,为此提供不同的服务方式: 

1)面向连接(虚电路)或无连接 

面向连接服务(TCP协议):是电话系统服务模式的抽象,即每一次完整的数据传输都要经过建立连接,使用连接,终止连接的过程。在数据传输过程中,各数据分组不携带目的地址,而使用连接号(connect ID)。本质上,连接是一个管道,收发数据不但顺序一致,而且内容相同。TCP协议提供面向连接的虚电路。

无连接服务(UDP协议):是邮政系统服务的抽象,每个分组都携带完整的目的地址,各分组在系统中独立传送。无连接服务不能保证分组的先后顺序,不进行分组出错的恢复与重传,不保证传输的可靠性。UDP协议提供无连接的数据报服务。 

下面给出这两种服务的类型及应用中的例子:

 

 

2)顺序 

在网络传输中,两个连续报文在端-端通信中可能经过不同路径,这样到达目的地时的顺序可能会与发送时不同。“顺序”是指接收数据顺序与发送数据顺序相同。TCP协议提供这项服务。 

3)差错控制 

保证应用程序接收的数据无差错的一种机制。检查差错的方法一般是采用检验“检查和(Checksum)”的方法。而保证传送无差错的方法是双方采用确认应答技术。TCP协议提供这项服务。 

4)流控制 

在数据传输过程中控制数据传输速率的一种机制,以保证数据不被丢失。TCP协议提供这项服务。 

5)字节流 

字节流方式指的是仅把传输中的报文看作是一个字节序列,不提供数据流的任何边界。TCP协议提供字节流服务。 

6)报文 

接收方要保存发送方的报文边界。UDP协议提供报文服务。 

7)全双工/半双工 

端-端间数据同时以两个方向/一个方向传送。 

8)缓存/带外数据 

在字节流服务中,由于没有报文边界,用户进程在某一时刻可以读或写任意数量的字节。为保证传输正确或采用有流控制的协议时,都要进行缓存。但对某些特殊的需求,如交互式应用程序,又会要求取消这种缓存。 在数据传送过程中,希望不通过常规传输方式传送给用户以便及时处理的某一类信息,如UNIX系统的中断键(Delete或Control-c)、终端流控制符(Control-s和Control-q),称为带外数据。逻辑上看,好象用户进程使用了一个独立的通道传输这些数据。该通道与每对连接的流相联系。由于Berkeley Software Distribution中对带外数据的实现与RFC 1122中规定的Host Agreement不一致,为了将互操作中的问题减到最小,应用程序编写者除非与现有服务互操作时要求带外数据外,最好不使用它。 

 

2.3 客户/服务器模式  

在TCP/IP网络应用中,通信的两个进程间相互作用的主要模式是客户/服务器模式(Client/Server model),即客户向服务器发出服务请求,服务器接收到请求后,提供相应的服务。客户/服务器模式的建立基于以下两点:首先,建立网络的起因是网络中软硬件资源、运算能力和信息不均等,需要共享,从而造就拥有众多资源的主机提供服务,资源较少的客户请求服务这一非对等作用。其次,网间进程通信完全是异步的,相互通信的进程间既不存在父子关系,又不共享内存缓冲区,因此需要一种机制为希望通信的进程间建立联系,为二者的数据交换提供同步,这就是基于不同的客户/服务器模式的TCP/IP。 客户/服务器模式在工作过程中采取的是主动请求方式: 

 

服务器方:

首先服务器方要先启动,并根据请求提供相应服务: 

1. 打开一通信通道并告知本地主机,它愿意在某一公认地址上(周知口,如FTP为21)接收客户请求; 

2. 等待客户请求到达该端口; 

3. 接收到重复服务请求,处理该请求并发送应答信号。接收到并发服务请求,要激活一新进程来处理这个客户请求(如UNIX系统中用fork、exec)。新进程处理此客户请求,并不需要对其它请求作出应答。服务完成后,关闭此新进程与客户的通信链路,并终止。 

4. 返回第二步,等待另一客户请求。 

5. 关闭服务器 

客户方: 

1. 打开一通信通道,并连接到服务器所在主机的特定端口; 

2. 向服务器发服务请求报文,等待并接收应答;继续提出请求...... 

3. 请求结束后关闭通信通道并终止。 

从上面所描述过程可知: 

1. 客户与服务器进程的作用是非对称的,因此编码不同。 

2. 服务进程一般是先于客户请求而启动的。只要系统运行,该服务进程一直存在,直到正常或强迫终止。 

 

2.4 套接字类型  

TCP/IP的socket提供下列三种类型套接字。 

流式套接字(SOCK_STREAM):

提供了一个面向连接、可靠的数据传输服务,数据无差错、无重复地发送,且按发送顺序接收。内设流量控

制,避免数据流超限;数据被看作是字节流,无长度限制。文件传送协议(FTP)即使用流式套接字。 

数据报式套接字(SOCK_DGRAM):

提供了一个无连接服务(UDP)。数据包以独立包形式被发送,不提供无错保证,

数据可能丢失或重复,并且接收顺序混乱。网络文件系统(NFS)使用数据报式套接字。 

原始式套接字(SOCK_RAW) :

该接口允许对较低层协议,如IP、ICMP直接访问。常用于检验新的协议实现或访问现有服务中配置的新设备。

 

2.4 典型套接字调用过程举例  

如前所述,TCP/IP协议的应用一般采用客户/服务器模式,因此在实际应用中,必须有客户和服务器两个进程,并且首先启动服务器,其系统调用时序图如下。 面向连接的协议(如TCP)的套接字系统调用如图2.1所示:

 

服务器必须首先启动,直到它执行完accept()调用,进入等待状态后,方能接收客户请求。假如客户在此前启动,则connect()将返回出错代码,连接不成功。

 

无连接协议(UDP)的套接字调用如图2.2所示:

无连接服务器也必须先启动,否则客户请求传不到服务进程。无连接客户不调用connect()。因此在数据发送之前,客户与服务器之间尚未建立完全相关,但各自通过socket()和bind()建立了半相关。发送数据时,发送方除指定本地套接字号外,还需指定接收方套接字号,从而在数据收发过程中动态地建立了全相关。 

 

实例 

本实例使用面向连接协议的客户/服务器模式,其流程如图2.3所示: 

 

服务器方程序:

1.    /* File Name: streams.c */   

2.    #include <winsock.h>   

3.    #include <stdio.h>   

4.    #define TRUE 1   

5.    /* 这个程序建立一个套接字,然后开始无限循环;每当它通过循环接收到一个连接,则打印出一个信息。 

6.    当连接断开,或接收到终止信息,则此连接结束,程序再接收一个新的连接。命令行的格式是:streams */  

7.       

8.      

9.    main( )   

10. {   

11.  int sock, length;   

12. struct sockaddr_in server;   

13.  struct sockaddr tcpaddr;   

14. int msgsock;   

15.  char buf[1024];   

16. int rval, len;   

17.    

18. /* 建立套接字 */   

19.  sock = socket(AF_INET, SOCK_STREAM, 0);   

20. if (sock < 0) {   

21.  perror(“opening stream socket”);   

22. exit(1);   

23.  }   

24.   

25.  /* 使用任意端口命名套接字 */   

26. server.sin_family = AF_INET;   

27.  server.sin_port = INADDR_ANY;   

28. if (bind(sock, (struct sockaddr *)&server, sizeof(server)) < 0) {   

29.  perror(“binding stream socket”);   

30. exit(1);   

31.  }   

32.   

33.  /* 找出指定的端口号并打印出来 */   

34. length = sizeof(server);   

35.  if (getsockname(sock, (struct sockaddr *)&server, &length) < 0) {   

36. perror(“getting socket name”);   

37.  exit(1);   

38. }   

39.  printf(“socket port #%d/n”, ntohs(server.sin_port));   

40.   

41.  /* 开始接收连接 */   

42. listen(sock, 5);   

43.  len = sizeof(struct sockaddr);   

44. do {   

45.  msgsock = accept(sock, (struct sockaddr *)&tcpaddr, (int *)&len);   

46. if (msgsock == -1)   

47.  perror(“accept”);   

48. else do{   

49.  memset(buf, 0, sizeof(buf));   

50. if ((rval = recv(msgsock, buf, 1024)) < 0)   

51.  perror(“reading stream message”);   

52. if (rval == 0)   

53.  printf(“ending connection /n”);   

54. else   

55.  printf(“-->;%s/n”, buf);   

56. }while (rval != 0);   

57.  closesocket(msgsock);   

58. while (TRUE);   

59.    

60. /* 因为这个程序已经有了一个无限循环,所以套接字“sock”从来不显式关闭。然而,当进程被杀死或正 

61.  常终止时,所有套接字都将自动地被关闭。*/   

62. exit(0);   

63.  }   

 

 

客户方程序:

1.    /* File Name: streamc.c */   

2.    #include <winsock.h>   

3.    #include <stdio.h>   

4.    #define DATA “half a league, half a league ...”   

5.    /* 这个程序建立套接字,然后与命令行给出的套接字连接;连接结束时,在连接上发送  

6.    一个消息,然后关闭套接字。命令行的格式是:streamc 主机名 端口号  

7.    端口号要与服务器程序的端口号相同 */   

8.    main(argc, argv)   

9.    int argc;   

10. char *argv[ ];   

11.  {   

12. int sock;   

13.  struct sockaddr_in server;   

14. struct hostent *hp, *gethostbyname( );   

15.  char buf[1024];   

16.   

17.  /* 建立套接字 */   

18. sock = socket(AF_INET, SOCK_STREAM, 0);   

19.  if (sock < 0) {   

20. perror(“opening stream socket”);   

21.  exit(1);   

22. }   

23.    

24. /* 使用命令行中指定的名字连接套接字 */   

25.  server.sin_family = AF_INET;   

26. hp = gethostbyname(argv[1]);   

27.  if (hp == 0) {   

28. fprintf(stderr, “%s: unknown host /n”, argv[1]);   

29.  exit(2);   

30. }   

31.  memcpy((char*)&server.sin_addr, (char*)hp->;h_addr, hp->;h_length);   

32. sever.sin_port = htons(atoi(argv[2]));   

33.    

34. if (connect(sock, (struct sockaddr*)&server, sizeof(server)) < 0) {   

35.  perror(“connecting stream socket”);   

36. exit(3);   

37.  }   

38.   

39.  if (send(sock, DATA, sizeof(DATA)) < 0)   

40. perror(“sending on stream socket”);   

41.  closesocket(sock);   

42. exit(0);   

43.  }   

 

 

2.5 一个通用的实例程序  

在上一节中,我们介绍了一个简单的socket程序实例。从这个例子我们可以看出,使用socket编程几乎有一个模式,即所有的程序几乎毫无例外地按相同的顺序调用相同的函数。因此我们可以设想,设计一个中间层,它向上提供几个简单的函数,程序只要调用这几个函数就可以实现普通的网络数据传输,程序设计者不必太多地关心socket程序设计的细节。 本节我们将介绍一个通用的网络程序接口,它向上层提供几个简单的函数,程序设计者只要使用这几个函数就可以完成绝大多数网络数据传输。这些函数将socket编程和上层隔离开来,它使用面向连接的流式套接字,采用非阻塞的工作机制,程序只要调用这些函数查询网络消息并作出相应的响应即可。这些函数包括: 

lInitSocketsStruct:初始化socket结构,获取服务端口号。客户程序使用。 

l InitPassiveSock:初始化socket结构,获取服务端口号,建立主套接字。服务器程序使用。 

l CloseMainSock:关闭主套接字。服务器程序使用。 

lCreateConnection:建立连接。客户程序使用。 

l AcceptConnection:接收连接。服务器程序使用。 

l CloseConnection:关闭连接。 

l QuerySocketsMsg:查询套接字消息。 

l SendPacket:发送数据。 

l RecvPacket:接收数据。 

2.5.1 头文件  

/*File Name: tcpsock.h */ 

/* 头文件包括socket程序经常用到的系统头文件(本例中给出的是SCO Unix下的头文件,其它版本的Unix的头文件可能略有不同),并定义了我们自己的两个数据结构及其实例变量,以及我们提供的函数说明。*/

[cpp] view plain copy print?

  1. /* File Name: tcpsock.h */   
  2. /*  头文件包括 socket 程序经常用到的系统头文件(本例中给出的是 SCO Unix下的头文件,其它版本的 Unix的头文件 
  3. 可能略有不同),并定义了我们自己的两个数据结构及其实例变量,以及我们提供的函数说明。*/   
  4. #include <stdio.h>   
  5. #include <string.h>   
  6. #include <time.h>   
  7. #include <sys/tape.h>   
  8. #include <sys/signal.h>   
  9. #include <sys/errno.h>   
  10. #include <sys/types.h>   
  11. #include <sys/ioctl.h>   
  12. #include <sys/select.h>   
  13. #include <sys/socket.h>   
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值