Linux IPC之Socket网络编程基础篇

UNIX IPC工具使用总结 里介绍了socket是一种用于通信的IPC工具。它允许位于同一主机跨主机上的应用程序之间交换数据。第一个被广泛接受的socket API实现于1983年,出现在4.2BSD中,实际上这组API已经被移植到了所有UNIX实现以及大多数操作系统上。

概述

在一个典型的C/S场景中,应用程序使用socket进行通信的方式如下:

  • 各个应用程序创建一个socket。socket是一个允许通信的“设备”,两个应用程序都需要用到它。
  • 服务器将自己的socket绑定到一个众所周知的地址上,使得客户端能够定位到它的位置。
// 使用socket系统调用,能够创建一个socket,它返回一个用来在后续系统调用中引用该socket的文件描述符
fd = socket(domain, type, protocol);

通信domain

socket存在于一个通信domain中,它确定:

  • 识别出一个socket的方法,即,socket“地址”的格式。
  • 通信范围,即,在位于同一主机上的应用程序之间,还是位于跨主机的应用程序之间。

现代操作系统至少支持下列domain:

  • UNIX(AF_UNIX)domain
    允许在同一主机上的应用程序之间进行通信。

POSIX.1g使用AF_LOCAL作为AF_UNIX的同义词,但是SUSv3并没有使用这个名称。

  • IPv4(AF_INET)domain
    允许在使用IPv4网络连接起来的主机上的应用程序之间进行通信。

  • IPv6(AF_INET6)domain
    允许在使用IPv6网络连接起来的主机上的应用程序之间进行通信。

尽管IPv6被设计成了IPv4的接任者,但目前后一种协议仍然是使用最广的协议。

总结

domain执行的通信应用程序间的通信地址格式地址结构
AF_UNIX内核中同一主机路径名sockaddr_un
AF_INETIPv4IPv4连接起来的主机32位IPv4地址 + 16位端口号sockaddr_in
AF_INET6IPv6IPv6连接起来的主机128位IPv6地址 + 16位端口号sockaddr_in6

socket类型

每个socket实现都至少提供了两种socket流和数据报。这两种socket类型在UNIX和Internet domain中都得到了支持。

属性数据报
可靠的传递?YESNO
消息边界保留?NOYES
面向连接?YESNO

流socket(SOCK_STREAM)

流socket提供了一个可靠的双向的字节流通信信道

  • 可靠的
    表示可以保证发送者传输的数据会完整无缺地到达接收应用程序(假设网络连接和接收者都不会崩溃),或收到一个传输失败的通知。

  • 双向的
    表示数据可以在两个socket之间的任意方向上传输。

  • 字节流
    表示与管道一样不存在消息边界的概念。

一个流socket类似于使用一对允许在两个应用程序之间进行双向通信的管道,它们之间的差别在于socket(Internet domain)允在在网络上进行通信。

数据报socket(SOCK_DGRAM)

数据报socket允许数据以被称为数据报的消息的形式进行交换。在数据报socket中,消息边界得到了保留,但是数据传输是不可靠的,消息的到达可能是无序的,重复的,或者根本就无法达到。

数据报socket是更一般的无连接socket。与流socket不同,一个数据报socket在使用时无需与另一个socket连接。
注意:数据报socket可以与另一个socket连接,但其语义与连接的流socket是不同的。

对比

在Internet domain中:

类型协议名称
流socket传输控制协议TCPTCP socket
数据报socket数据报协议UDPUDP socket

socket系统调用

关键的socket系统调用包括:

系统调用描述
socket()创建一个新的socket
bind()将一个socket绑定到一个地址上。通常,服务器需要使用这个调用来将其socket绑定到一个众所周知的地址上,使得客户端能够定位到该socket上。
listen()允许一个流socket接收来自其他socket的接入连接。
accept()在一个监听socket上接收来自一个对等应用程序的连接,并可选地返回对等socket的地址。
connet()建立与另一个socket之间的连接

在大多数Linux架构上(除了Alpha和IA-64),所有这些socket系统调用实际上被实现成了通过单个系统调用socketcall()进行多路复用的库函数(最初的时候)。但是,上述函数都被称为系统调用,是因为它们在最初的BSD实现,以及其他很多同时代的UNIX实现上,是被作为系统调用实现的。

socket I/O可以使用传统的read()write()系统调用使用,或使用一组socket特有的系统调用,如,send()recv()sendto()recvfrom()来完成。

注意:在默认情况下,这些系统调用在I/O操作无法被立即完成时会阻塞。通过使用fcntl()F_SETFL操作来启用O_NONBLOCK打开文件状态标记可以执行非阻塞I/O。

流socket注意事项

流socket的运作与电话系统类似。具体流程可以参考TCP连接建立和终止及TCP状态转换 。在大多数使用流socket的应用程序中,服务器会执行被动打开,而客户端会执行主动式打开。

pic

#include <sys/socket.h>

// return file descriptor on success, or -1 on error
int socket(int domain, int type, int protocol);

// return 0 on success, or -1 on error
int bind(int sockfd, const struct sockaddr *addr, socklen_t addrlen);

// 通用的地址结构(所有domain特定的地址结构模版),用途是,将各种domain特定的地址结构转换成单个类型,以供socket系统调用中的各个参数适用
struct sockaddr {
    sa_family_t sa_family;   /* Address family (AF_* constant) */
    char        sa_data[14]; /* Socket address (size varies according to socket domain) */
}

// return 0 on success, or -1 on error
int listen(int sockfd, int backlog);

// return file descriptor on success, or -1 on error
int accept(int sockfd, struct sockaddr *addr, socklen_t *addrlen);

// return 0 on success, or -1 on error
int connect(int sockfd, const struct sockaddr *addr, socklen_t addrlen);
  • socket()接口中,protocol参数通常为0,在裸socket(SOCK_RAW)中,会将protocol指定为IPPROTO_RAW。

从内核2.6.27开始,Linux为type参数提供了第二种用途,即允许两个非标准的标记与socket类型取OR。

  • 除了将一个服务器的socket绑定到一个众所周知的地址,对于一个Internet domain socket来讲,服务器可以不调用bind()而直接调用listen(),这将会导致内核为该socket选择一个临时端口。之后服务器可以使用getsockname()来获取socket的地址。

  • 无法在一个已连接的socket(即,已经成功执行connect()的socket,或由accept()返回的socket)上执行listen()。

  • 理解backlog参数的用途。

  1. 客户端可能会在服务器调用accept()之前调用connect(),这将会产生一个未决的连接。内核必须要记录所有未决的连接请求的相关信息,这样后续的accept()就能够处理这些请求。backlog参数允许限制这种未决连接的数量。在这个限制内的连接请求会立即成功,之外的连接请求就会阻塞直到一个未决的连接被accept()接受,并从未决连接队列删除为止。

  2. SUSv3规定实现应该通过在<sys/socket.h>中定义SOMAXCONN常量来发布这个限制。在Linux上,这个常量的值被定义为128。但是,从2.4.25内核起,Linux允许在运行时通过/proc/sys/net/core/somaxconn文件来调整这个限制。

  3. 在最初的BSD socket实现中,backlog的上限是5,并且在较早的代码中可以看到这个数值。但是,所有现代实现允许为backlog指定更高的值,这对于使用TCP socket服务大量客户的网络服务器来讲是由必要的。

pic

  • accept()通过文件描述符sockfd监听流socket上接受一个接入连接,如果在调用accept()时不存在未决的连接,那么调用就会阻塞直到有连接请求到达为止。传入accept()的剩余参数会返回对端socket的地址。如果不关心对等socket的地址,可以将addr和addrlen分别指定为NULL和0(后续可以通过getpeername())来获取对端的地址。

理解accept的关键:它会创建一个新socket,并且正是这个新socket会与执行connect()的对等socket进行连接。accept()返回的函数结果是已连接的socket的文件描述符。
从内核2.6.28开始,Linux支持一个新的非标准系统调用accept4()。这个系统调用执行的任务与accept()相同,但是,支持一个额外的参数flags,而这个参数可以用来改变系统调用的行为。目前系统支持两个标记:SOCK_CLOEXECSOCK_NONBLOCK

  • 如果connect()失败并且希望重新进行连接,那么SUSv3规定完成这个任务的可移植的方法是关闭这个socket,创建一个新socket,在该新socket上重新进行连接。

数据报socket注意事项

数据报socket的运作类似于邮政系统。

pic

// return number of bytes received, 0 on EOF, or -1 on error
ssize_t recvfrom(int sockfd, void *buffer, size_t length, int flags, struct sockaddr *src_addr, socklen_t *addrlen);

// return number of bytes sent, or -1 on error
ssize_t sendto(int sockfd, const void *buffer, size_t length, int flags, const struct sockaddr *dest_addr, socklen_t addrlen);
  • 不管length的参数值是什么,recvfrom()只会从一个数据报socket中读取一条消息。如果消息的大小超过了length字节,那么消息会被静默地截断为length字节。

  • 在Linux上可以使用sendto()发送长度为0的数据报,但不是所有的UNIX实现都允许这样做。

  • 尽管数据报socket是无连接的,但在数据报socket上应用connect()仍然是有效的。在数据报socket上调用connect()会导致内核记录这个socket()的对等socket的地址。

当一个数据报socket已连接之后:
1. 数据报的发送可在socket上使用write()或send()来完成,与sendto()一样,每个write()会发送一个独立的数据报。
2. 在这个socket上只能读取由对等socket发送的数据报。

  • 注意,connect()的作用对数据报socket是不对称的。通过再发起一个connect()可以修改一个已连接的数据报socket的对等socket。

总结

为了一个数据报socket设置一个对等socket,这种做法的一个明显优势是在该socket上传输数据时可以使用更简单的I/O系统调用,即,无需使用指定了dest_addr和addrlen参数的sendto(),而只需要使用write()即可。设置一个对等socket主要对那些需要单个对等socket发送多个数据报的应用程序是比较有用的。

在一些TCP/IP实践中,将一个数据报socket连接到一个对等socket能够带来性能上的提升。

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
Linux IPC(进程间通信)机制是Linux操作系统中用于进程间通信的一组方法和工具。其中包括三种主要的IPC机制:消息队列、信号量和共享内存。下面是每种IPC机制的简要介绍: 1. 消息队列:消息队列是一种进程间通信机制,它允许一个或多个进程向队列中添加消息,并允许其他进程从队列中读取消息。消息队列通常用于在不同进程之间传递数据,例如在客户端和服务器之间传递请求和响应数据。 2. 信号量:信号量是一种用于进程同步和互斥的机制。它允许多个进程共享一个资源,并确保每个进程都能够安全地访问该资源。信号量通常用于控制对共享资源的访问,例如在多个进程之间共享打印机或磁盘驱动器。 3. 共享内存:共享内存是一种允许多个进程共享同一块物理内存的机制。这种机制通常比其他IPC机制更快,因为它避免了数据复制的开销。共享内存通常用于在多个进程之间共享大量数据,例如在图像处理或数据库应用程序中。 下面是每种IPC机制的一个简单示例: 1. 消息队列: ```c #include <stdio.h> #include <stdlib.h> #include <string.h> #include <sys/ipc.h> #include <sys/msg.h> #define MSG_SIZE 1024 struct msg_buffer { long msg_type; char msg_text[MSG_SIZE]; } message; int main() { key_t key; int msg_id; // 创建消息队列 key = ftok("progfile", 65); msg_id = msgget(key, 0666 | IPC_CREAT); // 发送消息 message.msg_type = 1; strcpy(message.msg_text, "Hello World!"); msgsnd(msg_id, &message, sizeof(message), 0); // 接收消息 msgrcv(msg_id, &message, sizeof(message), 1, 0); printf("Received message: %s\n", message.msg_text); // 删除消息队列 msgctl(msg_id, IPC_RMID, NULL); return 0; } ``` 2. 信号量: ```c #include <stdio.h> #include <stdlib.h> #include <unistd.h> #include <sys/ipc.h> #include <sys/sem.h> int main() { key_t key; int sem_id; struct sembuf sem_op; // 创建信号量 key = ftok("progfile", 66); sem_id = semget(key, 1, 0666 | IPC_CREAT); // 初始化信号量 semctl(sem_id, 0, SETVAL, 1); // 进程同步 sem_op.sem_num = 0; sem_op.sem_op = -1; sem_op.sem_flg = 0; semop(sem_id, &sem_op, 1); printf("Critical section\n"); sleep(5); sem_op.sem_num = 0; sem_op.sem_op = 1; sem_op.sem_flg = 0; semop(sem_id, &sem_op, 1); // 删除信号量 semctl(sem_id, 0, IPC_RMID); return 0; } ``` 3. 共享内存: ```c #include <stdio.h> #include <stdlib.h> #include <string.h> #include <sys/ipc.h> #include <sys/shm.h> #define SHM_SIZE 1024 int main() { key_t key; int shm_id; char *shm_addr; // 创建共享内存 key = ftok("progfile", 67); shm_id = shmget(key, SHM_SIZE, 0666 | IPC_CREAT); // 连接共享内存 shm_addr = shmat(shm_id, NULL, 0); // 写入共享内存 strcpy(shm_addr, "Hello World!"); // 从共享内存中读取数据 printf("Shared memory data: %s\n", shm_addr); // 分离共享内存 shmdt(shm_addr); // 删除共享内存 shmctl(shm_id, IPC_RMID, NULL); return 0; } ```

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值