Linux下socket网络编程详解

最新推荐文章于 2023-02-22 15:41:50 发布

EagleAIGC

最新推荐文章于 2023-02-22 15:41:50 发布

阅读量2.2k

点赞数 1

分类专栏：网络传输协议 Linux 文章标签： Linux socket 网络编程 TCPIP

Linux 同时被 2 个专栏收录

14 篇文章 0 订阅

订阅专栏

网络传输协议

13 篇文章 0 订阅

订阅专栏

转载自：http://blog.chinaunix.net/uid-20511624-id-1659107.html

1、什么是Socket

Socket接口是TCP/IP网络的API，Socket接口定义了许多函数或例程，程式员能够用他们来研发TCP/IP网络上的应用程式。要学Internet上的TCP/IP网络编程，必须理解Socket接口。

Socket接口设计者最先是将接口放在Unix操作系统里面的。假如了解Unix系统的输入和输出的话，就很容易了解Socket了。网络的Socket数据传输是一种特别的I/O，Socket也是一种文档描述符。Socket也具备一个类似于打开文档的函数调用Socket()，该函数返回一个整型的Socket描述符，随后的连接建立、数据传输等操作都是通过该Socket实现的。常用的Socket类型有两种：流式Socket （SOCK_STREAM）和数据报式Socket（SOCK_DGRAM）。流式是一种面向连接的Socket，针对于面向连接的TCP服务应用；数据报式Socket是一种无连接的Socket，对应于无连接的UDP服务应用。

2、Socket建立

为了建立Socket，程式能够调用Socket函数，该函数返回一个类似于文档描述符的句柄。socket函数原型为：

int socket(int domain, int type, int protocol);

domain：指明所使用的协议族，通常为PF_INET，表示互连网协议族（TCP/IP协议族）；

type：指定socket的类型： SOCK_STREAM 或SOCK_DGRAM，Socket接口还定义了原始Socket（SOCK_RAW），允许程式使用低层协议；

protocol：通常赋值"0"。

Socket()调用返回一个整型socket描述符，您能够在后面的调用使用他。

Socket描述符是个指向内部数据结构的指针，他指向描述符表入口。调用Socket函数时，socket执行体将建立一个Socket，实际上"建立一个Socket"意味着为一个Socket数据结构分配存储空间。Socket执行体为您管理描述符表。

两个网络程式之间的一个网络连接包括五种信息：通信协议、本地协议地址、本地主机端口、远端主机地址和远端协议端口。Socket数据结构中包含这五种信息。

3、Socket配置

通过socket调用返回一个socket描述符后，在使用socket进行网络传输以前，必须配置该socket。面向连接的socket客户端通过调用Connect函数在socket数据结构中保存本地和远端信息。无连接socket的客户端和服务端连同面向连接socket的服务端通过调用bind函数来配置本地信息。

Bind函数将socket和本机上的一个端口相关联，随后您就能够在该端口监听服务请求。Bind函数原型为：

int bind(int sockfd,struct sockaddr *my_addr, int addrlen);

Sockfd：是调用socket函数返回的socket描述符；

my_addr：是个指向包含有本机IP地址及端口号等信息的sockaddr类型的指针；

addrlen：常被配置为sizeof(struct sockaddr)。

struct sockaddr结构类型是用来保存socket信息的：

struct sockaddr {
    unsigned short sa_family; /* 地址族， AF_xxx */
    char sa_data[14]; /* 14 字节的协议地址 */
};

sa_family一般为AF_INET，代表Internet（TCP/IP）地址族；sa_data则包含该socket的IP地址和端口号。

另外更有一种结构类型：

struct sockaddr_in {
    short int sin_family; /* 地址族 */
    unsigned short int sin_port; /* 端口号 */
    struct in_addr sin_addr; /* IP地址 */
    unsigned char sin_zero[8]; /* 填充0 以保持和struct sockaddr同样大小 */
};

这个结构更方便使用。sin_zero用来将sockaddr_in结构填充到和struct sockaddr同样的长度，能够用bzero()或memset()函数将其置为零。指向sockaddr_in 的指针和指向sockaddr的指针能够相互转换，这意味着假如一个函数所需参数类型是sockaddr时，您能够在函数调用的时候将一个指向sockaddr_in的指针转换为指向sockaddr的指针；或相反。

使用bind函数时，能够用下面的赋值实现自动获得本机IP地址和随机获取一个没有被占用的端口号：

my_addr.sin_port = 0; /* 系统随机选择一个未被使用的端口号 */

my_addr.sin_addr.s_addr = INADDR_ANY; /* 填入本机IP地址 */

通过将my_addr.sin_port置为0，函数会自动为您选择一个未占用的端口来使用。同样，通过将my_addr.sin_addr.s_addr置为INADDR_ANY，系统会自动填入本机IP地址。

注意在使用bind函数是需要将sin_port和sin_addr转换成为网络字节优先顺序；而sin_addr则无需转换。

电脑数据存储有两种字节优先顺序：高位字节优先和低位字节优先。Internet上数据以高位字节优先顺序在网络上传输，所以对于在内部是以低位字节优先方式存储数据的机器，在Internet上传输数据时就需要进行转换，否则就会出现数据不一致。

下面是几个字节顺序转换函数：

（1）htonl()：把32位值从主机字节序转换成网络字节序

（2）htons()：把16位值从主机字节序转换成网络字节序

（3）ntohl()：把32位值从网络字节序转换成主机字节序

（4）ntohs()：把16位值从网络字节序转换成主机字节序

Bind()函数在成功被调用时返回0；出现错误时返回"-1"并将errno置为相应的错误号。需要注意的是，在调用bind函数时一般不要将端口号置为小于1024的值，因为1到1024是保留端口号，您能够选择大于1024中的任何一个没有被占用的端口号。

4、连接建立

面向连接的客户程式使用Connect函数来配置socket并和远端服务器建立一个TCP连接，其函数原型为：

int connect(int sockfd, struct sockaddr *serv_addr,int addrlen);

Sockfd：是socket函数返回的socket描述符；

serv_addr：是包含远端主机IP地址和端口号的指针；

addrlen：是远端地址结构的长度。

Connect函数在出现错误时返回-1，并且配置errno为相应的错误码。进行客户端程式设计无须调用bind()，因为这种情况下只需知道目的机器的IP地址，而客户通过哪个端口和服务器建立连接并无需关心，socket执行体为您的程式自动选择一个未被占用的端口，并通知您的程式数据什么时候到达端口。

Connect函数启动和远端主机的直接连接。只有面向连接的客户程式使用socket时才需要将此socket和远端主机相连。无连接协议从不建立直接连接。面向连接的服务器也从不启动一个连接，他只是被动的在协议端口监听客户的请求。

Listen函数使socket处于被动的监听模式，并为该socket建立一个输入数据队列，将到达的服务请求保存在此队列中，直到程式处理他们。其函数原型为：

int listen(int sockfd， int backlog);

Sockfd：是Socket系统调用返回的socket 描述符；

backlog：指定在请求队列中允许的最大请求数，进入的连接请求将在队列中等待accept()他们（参考下文）。

Backlog对队列中等待服务的请求的数目进行了限制，大多数系统缺省值为20。假如一个服务请求到来时，输入队列已满，该socket将拒绝连接请求，客户将收到一个出错信息。当出现错误时listen函数返回-1，并置相应的errno错误码。

accept()函数让服务器接收客户的连接请求。在建立好输入队列后，服务器就调用accept函数，然后睡眠并等待客户的连接请求。其函数原型为：

int accept(int sockfd, void *addr, int *addrlen);

sockfd：是被监听的socket描述符；

addr：通常是个指向sockaddr_in变量的指针，该变量用来存放提出连接请求服务的主机的信息（某台主机从某个端口发出该请求）；

addrten：通常为一个指向值为sizeof(struct sockaddr_in)的整型指针变量。出现错误时accept函数返回-1并置相应的errno值。

首先，当accept函数监控的socket收到连接请求时，socket执行体将建立一个新的socket，执行体将这个新socket和请求连接进程的地址联系起来，收到服务请求的初始socket仍能够继续在以前的socket上监听，同时能够在新的socket描述符上进行数据传输操作。

5、数据传输

send()和recv()这两个函数用于面向连接的socket上进行数据传输。

send()函数原型为：

int send(int sockfd, const void *msg, int len, int flags);

Sockfd：是您想用来传输数据的socket描述符；

msg：是个指向要发送数据的指针；

Len：是以字节为单位的数据的长度；

flags：一般情况下置为0（关于该参数的用法可参照man手册）。

send()函数返回实际上发送出的字节数，可能会少于您希望发送的数据。在程式中应该将send()的返回值和欲发送的字节数进行比较。当send()返回值和len不匹配时，应该对这种情况进行处理。

char *msg = "Hello!";
int len, bytes_sent;
……
len = strlen(msg);
bytes_sent = send(sockfd, msg,len,0);
……

recv()函数原型为：

int recv(int sockfd,void *buf,int len,unsigned int flags);

sockfd：是接受数据的socket描述符；

buf：是存放接收数据的缓冲区；

len：是缓冲的长度；

flags也被置为0。

Recv()返回实际上接收的字节数，当出现错误时，返回-1并置相应的errno值。

sendto()和recvfrom()用于在无连接的数据报socket方式下进行数据传输。由于本地socket并没有和远端机器建立连接，所以在发送数据时应指明目的地址。

sendto()函数原型为：

int sendto(int sockfd, const void *msg,int len,unsigned int flags,const struct sockaddr *to, int tolen);

该函数比send()函数多了两个参数，to表示目地机的IP地址和端口号信息，而tolen常常被赋值为sizeof (struct sockaddr)。sendto 函数也返回实际发送的数据字节长度或在出现发送错误时返回-1。

recvfrom()函数原型为：

int recvfrom(int sockfd,void *buf,int len,unsigned int flags,struct sockaddr *from,int *fromlen);

from是个struct sockaddr类型的变量，该变量保存源机的IP地址及端口号。fromlen常置为sizeof (struct sockaddr)。当recvfrom()返回时，fromlen包含实际存入from中的数据字节数。recvfrom()函数返回接收到的字节数或当出现错误时返回-1，并置相应的errno。

假如您对数据报socket调用了connect()函数时，您也能够利用send()和recv()进行数据传输，但该socket仍然是数据报socket，并且利用传输层的UDP服务。但在发送或接收数据报时，内核会自动为之加上目地和源地址信息。

6、结束传输

当任何的数据操作结束以后，您能够调用close()函数来释放该socket，从而停止在该socket上的任何数据操作：close(sockfd);

您也能够调用shutdown()函数来关闭该socket。该函数允许您只停止在某个方向上的数据传输，而一个方向上的数据传输继续进行。如您能够关闭某socket的写操作而允许继续在该socket上接受数据，直至读入任何数据。

int shutdown(int sockfd,int how);

sockfd：是需要关闭的socket的描述符；

how：允许为shutdown操作选择以下几种方式：

（1）0-------不允许继续接收数据

（2）1-------不允许继续发送数据

（3）2-------不允许继续发送和接收数据，

（4）均为允许则调用close ()

shutdown在操作成功时返回0，在出现错误时返回-1并置相应errno。

7、Socket编程实例

代码实例中的服务器通过socket连接向客户端发送字符串"Hello, you are connected!"。只要在服务器上运行该服务器软件，在客户端运行客户软件，客户端就会收到该字符串。该服务器软件代码如下：

#include 
#include 
#define SERVPORT 3333 /*服务器监听端口号 */
#define BACKLOG 10 /* 最大同时连接请求数 */
void main(){
    int sockfd,client_fd; /*sock_fd：监听socket；client_fd：数据传输socket */
    struct sockaddr_in my_addr; /* 本机地址信息 */
    struct sockaddr_in remote_addr; /* 客户端地址信息 */
    if ((sockfd = socket(AF_INET, SOCK_STREAM, 0)) == -1) {
        perror("socket创建出错！"); exit(1);
    }
    my_addr.sin_family=AF_INET;
    my_addr.sin_port=htons(SERVPORT);
    my_addr.sin_addr.s_addr = INADDR_ANY;
    bzero(&(my_addr.sin_zero),8);
    if (bind(sockfd, (struct sockaddr *)&my_addr, sizeof(struct sockaddr)) == -1) {
        perror("bind出错！");
        exit(1);
    }
    if (listen(sockfd, BACKLOG) == -1) {
        perror("listen出错！");
        exit(1);
    }
    while(1) {
        socklen_t size = sizeof(struct sockaddr_in);
        if ((client_fd = accept(sockfd, (struct sockaddr *)&remote_addr, &size)) == -1) {
            perror("accept出错");
            continue;
        }
        printf("received a connection from %s\n", inet_ntoa(remote_addr.sin_addr));
        if (!fork()) { /* 子进程代码段 */
            if (send(client_fd, "Hello, you are connected!\n", 26, 0) == -1) {
                perror("send出错！");
                close(client_fd);
                exit(0);
            }
            close(client_fd);
        }
    }
}

服务器的工作流程是这样的：首先调用socket函数创建一个Socket，然后调用bind函数将其和本机地址连同一个本地端口号绑定，然后调用listen在相应的socket上监听，当accpet接收到一个连接服务请求时，将生成一个新的socket。服务器显示该客户机的IP地址，并通过新的socket向客户端发送字符串"Hello，you are connected!"。最后关闭该socket。

代码实例中的fork()函数生成一个子进程来处理数据传输部分，fork()语句对于子进程返回的值为0。所以包含fork函数的if语句是子进程代码部分，他和if语句后面的父进程代码部分是并发执行的。客户端程式代码如下：

#include 
#include 
#define SERVPORT 3333
#define MAXDATASIZE 100 /*每次最大数据传输量 */
void main(int argc, char *argv[]){
    int sockfd, recvbytes;
    char buf[MAXDATASIZE];
    struct hostent *host;
    struct sockaddr_in serv_addr;
    if (argc h_addr);
    bzero(&(serv_addr.sin_zero),8);
    if (connect(sockfd, (struct sockaddr *)&serv_addr, sizeof(struct sockaddr)) == -1) {
        perror("connect出错！");
        exit(1);
    }
    if ((recvbytes=recv(sockfd, buf, MAXDATASIZE, 0)) ==-1) {
        perror("recv出错！");
        exit(1);
    }
    buf[recvbytes] = '\0';
    printf("Received: %s",buf);
    close(sockfd);
}

客户端程式首先通过服务器域名获得服务器的IP地址，然后创建一个socket，调用connect函数和服务器建立连接，连接成功之后接收从服务器发送过来的数据，最后关闭socket。

函数gethostbyname()是完成域名转换的。由于IP地址难以记忆和读写，所以为了方便，人们常常用域名来表示主机，这就需要进行域名和IP地址的转换。函数原型为：

struct hostent *gethostbyname(const char *name);

函数返回为hosten的结构类型，他的定义如下：

struct hostent {
    char *h_name; /* 主机的官方域名 */
    char **h_aliases; /* 一个以NULL结尾的主机别名数组 */
    int h_addrtype; /* 返回的地址类型，在Internet环境下为AF-INET */
    int h_length; /* 地址的字节长度 */
    char **h_addr_list; /* 一个以0结尾的数组，包含该主机的任何地址*/
};
#define h_addr h_addr_list[0] /*在h-addr-list中的第一个地址*/

当gethostname()调用成功时，返回指向struct hosten的指针，当调用失败时返回-1。当调用gethostbyname时，您不能使用perror()函数来输出错误信息，而应该使用herror()函数来输出。

无连接的客户/服务器程式的在原理上和连接的客户/服务器是相同的，两者的区别在于无连接的客户/服务器中的客户一般无需建立连接，而且在发送接收数据时，需要指定远端机的地址。

阻塞和非阻塞

阻塞函数在完成其指定的任务以前不允许程式调用另一个函数。例如，程式执行一个读数据的函数调用时，在此函数完成读操作以前将不会执行下一程式语句。当服务器运行到accept语句时，而没有客户连接服务请求到来，服务器就会停止在accept语句上等待连接服务请求的到来。这种情况称为阻塞（blocking）。而非阻塞操作则能够立即完成。比如，假如您希望服务器仅仅注意检查是否有客户在等待连接，有就接受连接，否则就继续做其他事情，则能够通过将Socket配置为非阻塞方式来实现。非阻塞socket在没有客户在等待时就使accept调用立即返回。

#include 
#include 
……
sockfd = socket(AF_INET,SOCK_STREAM,0);
fcntl(sockfd,F_SETFL,O_NONBLOCK)；
……

通过配置socket为非阻塞方式，能够实现"轮询"若干Socket。当企图从一个没有数据等待处理的非阻塞Socket读入数据时，函数将立即返回，返回值为-1，并置errno值为EWOULDBLOCK。但是这种"轮询"会使CPU处于忙等待方式，从而降低性能，浪费系统资源。而调用 select()会有效地解决这个问题，他允许您把进程本身挂起来，而同时使系统内核监听所需要的一组文档描述符的任何活动，只要确认在任何被监控的文档描述符上出现活动，select()调用将返回指示该文档描述符已准备好的信息，从而实现了为进程选出随机的变化，而不必由进程本身对输入进行测试而浪费 CPU开销。Select函数原型为:

int select(int numfds,fd_set *readfds,fd_set *writefds，fd_set *exceptfds,struct timeval *timeout);

其中readfds、writefds、exceptfds分别是被select()监控的读、写和异常处理的文档描述符集合。假如您希望确定是否能够从标准输入和某个socket描述符读取数据，您只需要将标准输入的文档描述符0和相应的sockdtfd加入到readfds集合中；numfds的值是需要检查的号码最高的文档描述符加1，这个例子中numfds的值应为sockfd+1；当select返回时，readfds将被修改，指示某个文档描述符已准备被读取，您能够通过FD_ISSSET()来测试。为了实现fd_set中对应的文档描述符的配置、复位和测试，他提供了一组宏：

FD_ZERO(fd_set *set)----清除一个文档描述符集；

FD_SET(int fd,fd_set *set)----将一个文档描述符加入文档描述符集中；

FD_CLR(int fd,fd_set *set)----将一个文档描述符从文档描述符集中清除；

FD_ISSET(int fd,fd_set *set)----试判断是否文档描述符被置位。

Timeout参数是个指向struct timeval类型的指针，他能够使select()在等待timeout长时间后没有文档描述符准备好即返回。struct timeval数据结构为：

struct timeval {
　　 int tv_sec; /* seconds */
　　 int tv_usec; /* microseconds */
};

8、POP3客户端实例

下面的代码实例基于POP3的客户协议，和邮件服务器连接并取回指定用户帐号的邮件。和邮件服务器交互的命令存储在字符串数组POPMessage中，程式通过一个do-while循环依次发送这些命令。

#include 
#include 
#define POP3SERVPORT 110
#define MAXDATASIZE 4096
void main(int argc, char *argv[]){
    int sockfd;
    struct hostent *host;
    struct sockaddr_in serv_addr;
    char *POPMessage[]={"USER userid\r\n",
                        "PASS password\r\n",
                        "STAT\r\n",
                        "LIST\r\n",
                        "RETR 1\r\n",
                        "DELE 1\r\n",
                        "QUIT\r\n",
                        NULL};
    int iLength;
    int iMsg=0;
    int iEnd=0;
    char buf[MAXDATASIZE];
    if((host=gethostbyname("your.server"))==NULL) {
        perror("gethostbyname error");
        exit(1);
    }
    if ((sockfd = socket(AF_INET, SOCK_STREAM, 0)) == -1){
        perror("socket error");
        exit(1);
    }
    serv_addr.sin_family=AF_INET;
    serv_addr.sin_port=htons(POP3SERVPORT);
    serv_addr.sin_addr = *((struct in_addr *)host->h_addr);
    bzero(&(serv_addr.sin_zero),8);
    if (connect(sockfd, (struct sockaddr *)&serv_addr,sizeof(struct sockaddr))==-1){
        perror("connect error");
        exit(1);
    }
    do {
        send(sockfd,POPMessage[iMsg],strlen(POPMessage[iMsg]),0);
        printf("have sent: %s",POPMessage[iMsg]);
        iLength=recv(sockfd,buf+iEnd,sizeof(buf)-iEnd,0);
        iEnd+=iLength;
        buf[iEnd]='\0';
        printf("received: %s,%d\n",buf,iMsg);
        iMsg++;
    } while (POPMessage[iMsg]);
    close(sockfd);
}