Linux网络编程——Unix本地套接字

概述

今天给大家讲解网络编程中的一个内容——Unix 本地套接字。

发现很多人不知道或者不太了解 Unix 本地套接字这个概念,这也难怪,socket API 原本就是为多台主机之间网络通信设计的,并且这种网络 socket 同样支持单台主机上的进程间通信,当然这样做的话,仍然需要 IP 地址和端口号(通过 loopback 地址 127.0.0.1)。Unix本地套接字,其实就是一种专门用于本地(也就是单个主机上的)网络通信的一种方法,它所用的 API 跟我们之前用的网络 socket API 是一样的。

本文要介绍的 Unix 本地套接字是在 socket 的框架上发展出一种 IPC 机制,即 UNIX Domain Socket,也就是 UNIX 本地套接字,或者称为 UNIX 域套接字。相比于网络 socket 和 IPC,Unix本地套接字有其自身的特点和优势,下面我们就来看一下吧。

虽然在很多教材中经常把Unix本地套接字放在网络编程里面进行讲解,但实际上,这种通信方式更类似于我们之前所学的IPC(进程间通信)的方式,比如无名管道(pipe)、有名管道(mkfifo)。但是,Unix域套接字所提供的控制方式会更多一些,比如说TCP(字节流套接字)提供等待连接的功能,UDP(数据报套接字)提供帧同步功能,同时也是全双工的(比如使用 socketpair 创建的流管道中的两个描述符都是既可读又可写的)。

TCP 和 UDP

首先,我们回顾一下,TCP 和 UDP 套接字的服务端和客户端,从 socket 的创建,到连接,到数据传输,再到关闭 socket 的整个流程。

TCP 是一种面向连接的字节流套接字,所以服务端需要通过 listen() 转变为被动 socket,通过 accept() 等待连接。

图1. TCP 客户/服务器通信流程

而对于 UDP 来说,就比较简单了,因为它是一种无连接的数据报套接字,实际上,客户/服务端的概念也弱化了。

图2. UDP 通信流程

Unix 本地套接字 API

前面我们说过,Unix 域套接字所使用的 API 其实跟我们之前用的 socket API 是一样的,并且对于 TCP 和 UDP,其工作流程跟上图的网络 socket 完全一样。

那么,下面我们就来看一下如何通过这些 API 来创建并使用我们的 Unix 本地套接字,以及它们之间有什么区别,然后再通过一个简单的示例程序来体验一下。

创建套接字

首先是 socket 的创建。同样使用 socket() 这个函数。

这里写图片描述

但是它的第一个参数 domain 不再是 AF_INET 或者 PF_INET,而是 AF_UNIX,表示的就是 Unix 域本地套接字。那 AF_LOCAL 又是什么呢?这其实是历史原因造成的,我们的主题是“Unix本地套接字”或者“Unix域套接字”,但实际上我们用是Linux,对吧。那其实,为了消除它对 Unix 操作系统的依赖,在 POSIX 标准中,早就已经将 AF_UNIX 变成 AF_LOCAL 了,但是尽管如此,我们依然习惯使用“Unix域”这个称谓,因此,更推荐大家使用 AF_LOCAL

第二个参数的话,跟 Internet 域套接字一样,可以是 SOCK_STREAMSOCK_DGRAMSOCK_RAW,但实际上,几乎没见过使用原始套接字的。所以一般来说 Unix 提供两类套接字,也就是字节流套接字(类似于TCP)和数据报套接字(类似于UDP)。

第三个参数 Protocol,显然,因为第二个参数 type 不是原始套接字,所以 protocol 一般填 0 就可以了。

绑定地址

创建完套接字,接下来就是通过 bind() 函数绑定地址,但对于 Unix 本地套接字来说,绑定的地址就不是原来的“IP地址 + 端口号”了,而是一个有效的路径。

这里写图片描述

本地套接字的地址结构体 sockaddr_un 的后缀是 _un,表示 Unix,而不是原来的 sockaddr_in(Internet)。我们来看一下这个Unix域套接字的地址结构体中包含哪些内容:

这里写图片描述

Unix 本地套接字的地址结构体中包含两个成员,其中 sun_family 表示协议族,填 AF_LOCALAF_UNIX 即可;sun_path 表示一个路径名。

从这里面可以很明显得看出 Unix 域套接字与原来的 网络套接字的区别,Unix 域中用于标识客户和服务器的协议地址是普通文件系统中的路径名,而这个文件就称为套接字文件

这里要强调一下的是,Unix 本地套接字关联的这个路径名应该是一个绝对路径名,而不是一个相对路径名。为什么呢?因为解析相对路径依赖于调用者的当前工作目录,也就是说,要是服务器绑定了一个相对路径名,那么客户端也得在与服务端相同的目录中才能成功调用connect(连接)或者sendto(发送)这样一些函数。显然,这样就会导致程序出现异常情况,所以建议大家最好使用一个绝对路径名。

这个路径名,其实还要分为两种,一种是我们上面所提到的普通路径名,另一种是抽象路径名。普通路径名是一个正常的字符串,也就是说,sun_path 字段是以空字符(’\0’)结尾的。而抽象路径名,sun_path 字段的第一个字节需要设置成 NULL(’\0’),所以在计算抽象路径名的长度的时候就要特别小心了,否则在解析抽象路径名时就有可能出现异常情况,因为抽象路径名不是像解析普通路径名那样,解析到第一个 NULL 就可以停止了。

使用抽象路径名的好处是,因为不会再在文件系统中创建文件了,所以对于抽象路径名来说,就不需要担心与文件系统中已存在的文件产生名字冲突的问题了,也不需要在使用完套接字之后删除附带产生的这个文件了,当套接字被关闭之后会自动删除这个抽象名。

其他API

其他的一些 API,比如 listen()、accept()、connect(),以及数据通信用的 read()、write()、recv()、send()、recvfrom()、sendto()、recvmsg()、sendmsg(),用法跟网络 socket 基本一样,主要是地址结构体需要注意一下。

这里写图片描述

另外,在 Unix 本地套接字的使用中,还经常用到这些 API:

(1)用于创建类似于无名管道(pipe)的本地套接字

int socketpair(int domain, int type, int protocol, int sv[2]);

(2)当不再需要这个 Unix 域套接字时,应删除路径名对应的文件

int unlink(const char *pathname);
int remove(const char *pathname);

注意,如果是抽象路径名,就不需要在使用完本地套接字后手动删除对应的套接字文件,因为当本地套接字被关闭之后,内核会自动删除这个抽象名。

(3)获取本地套接字的地址信息

int getsockname(int sockfd, struct sockaddr *addr, socklen_t *addrlen);

示例

TCP(字节流套接字)

在这个例子中,我们使用绝对路径名"/tmp/unix.str"来实现一个字节流的本地套接字,服务端接收数据,客户端发送数据。

【unixstr_serv.c】

#include <stdio.h>
#include <stdlib.h>
#include <unistd.h>
#include <sys/types.h>
#include <sys/socket.h>
#include <sys/un.h>

#define UNIXSTR_PATH "/tmp/unix.str"
#define LISTENQ 5
#define BUFFER_SIZE 256

int main(void)
{
	int listenfd, connfd;
	socklen_t len;
	struct sockaddr_un servaddr, cliaddr;

	if(-1 == (listenfd = socket(AF_LOCAL, SOCK_STREAM, 0)))
	{
		perror("socket");
		exit(EXIT_FAILURE);
	}

	unlink(UNIXSTR_PATH);

	bzero(&servaddr, sizeof(servaddr));
	servaddr.sun_family = AF_LOCAL;
	strcpy(servaddr.sun_path, UNIXSTR_PATH);
	if(-1 == bind(listenfd, (struct sockaddr *)&servaddr, sizeof(servaddr)))
	{
		perror("bind");
		exit(EXIT_FAILURE);
	}

	listen(listenfd, LISTENQ);

	len = sizeof(cliaddr);

	if(-1 == (connfd = accept(listenfd, (struct sockaddr *)&cliaddr, &len)))
	{
		perror("accept");
		exit(EXIT_FAILURE);
	}

	char buf[BUFFER_SIZE];

	while(1)
	{
		bzero(buf, sizeof(buf));
		if(read(connfd, buf, BUFFER_SIZE) == 0) break;
		printf("Receive: %s", buf);
	}

	close(listenfd);
	close(connfd);
	unlink(UNIXSTR_PATH);

	return 0;
}

【unixstr_cli.c】

#include <stdio.h>
#include <stdlib.h>
#include <unistd.h>
#include <sys/types.h>
#include <sys/socket.h>
#include <sys/un.h>

#define UNIXSTR_PATH "/tmp/unix.str"
#define LISTENQ 5
#define BUFFER_SIZE 256

int main(void)
{
	int sockfd;
	struct sockaddr_un servaddr;

	sockfd = socket(AF_LOCAL, SOCK_STREAM, 0);
	
	bzero(&servaddr, sizeof(servaddr));
	servaddr.sun_family = AF_LOCAL;
	strcpy(servaddr.sun_path, UNIXSTR_PATH);

	connect(sockfd, (struct sockaddr *)&servaddr, sizeof(servaddr));

	char buf[BUFFER_SIZE];

	while(1)
	{
		bzero(buf, sizeof(BUFFER_SIZE));
		printf(">> ");
		if(fgets(buf, BUFFER_SIZE, stdin) == NULL)
		{
			break;
		}
		write(sockfd, buf, strlen(buf));
	}

	close(sockfd);
	
	return 0;
}

有兴趣的童鞋可以自己编译、执行,看看运行效果,我们这里来看一下 /tmp/unix.str 这个文件吧。

rudy@ubuntu12:/tmp$ ls -l unix.str 
srwxrwxr-x 1 rudy rudy 0 1026 11:58 unix.str

显然,文件类型为“s”,代表套接字文件,也就是 S_IFSOCK 类型。

UDP(数据报套接字)

类似于上面 TCP 的例子,我们使用绝对路径名"/tmp/unix.dg"来实现一个数据报的本地套接字,一端接收数据,一端发送数据。

【unixdg_serv.c】

#include <stdio.h>
#include <stdlib.h>
#include <unistd.h>
#include <sys/types.h>
#include <sys/socket.h>
#include <sys/un.h>

#define UNIXDG_PATH "/tmp/unix.dg"
#define BUFFER_SIZE 256

int main(void)
{
	int sockfd;
	struct sockaddr_un servaddr, cliaddr;

	sockfd = socket(AF_LOCAL, SOCK_DGRAM, 0);

	unlink(UNIXDG_PATH);

	bzero(&servaddr, sizeof(servaddr));
	servaddr.sun_family = AF_LOCAL;
	strcpy(servaddr.sun_path, UNIXDG_PATH);

	bind(sockfd, (struct sockaddr *)&servaddr, sizeof(servaddr));

	socklen_t len = sizeof(cliaddr);
	char buf[BUFFER_SIZE];

	while(1)
	{
		bzero(buf, BUFFER_SIZE);

		if(0 == recvfrom(sockfd, buf, BUFFER_SIZE, 0, (struct sockaddr *)&cliaddr, &len))
		{
			break;
		}
		printf("recvfrom: %s", buf);
	}

	close(sockfd);
	unlink(UNIXDG_PATH);

	return 0;
}

【unixdg_cli.c】

#include <stdio.h>
#include <stdlib.h>
#include <unistd.h>
#include <sys/types.h>
#include <sys/socket.h>
#include <sys/un.h>

#define UNIXDG_PATH "/tmp/unix.dg"
#define BUFFER_SIZE 256

int main(void)
{
	int sockfd;
	struct sockaddr_un servaddr, cliaddr;
	socklen_t len;

	sockfd = socket(AF_LOCAL, SOCK_DGRAM, 0);

	/* local address */
	bzero(&cliaddr, sizeof(cliaddr));
	cliaddr.sun_family = AF_LOCAL;
	strcpy(cliaddr.sun_path, UNIXDG_PATH);
	bind(sockfd, (struct sockaddr *)&cliaddr, sizeof(cliaddr));

	/* remote address */
	bzero(&servaddr, sizeof(servaddr));
	servaddr.sun_family = AF_LOCAL;
	strcpy(servaddr.sun_path, UNIXDG_PATH);
	len = sizeof(servaddr);

	char buf[BUFFER_SIZE];

	while(1)
	{
		bzero(buf, BUFFER_SIZE);

		printf(">> ");
		if(fgets(buf, BUFFER_SIZE, stdin) == NULL)
		{
			break;
		}
		sendto(sockfd, buf, strlen(buf), 0, (struct sockaddr *)&servaddr, len);
	}

	close(sockfd);

	return 0;	
}

需要注意的是,跟网络套接字不一样,对于 Unix 域套接字的 UDP 客户端,必须 bind 一个路径名到 UDP 套接字,以使得 UDP 服务器有发送应答的目的地。

总结

通过上面简单的示例,我们可以看到 Unix 本地套接字跟 Internet 套接字虽然使用相同的 API,但用法上又有些不同,跟IPC(比如管道、消息队列、共享内存等)相比,也有不同。我们可以简单地把 Unix 本地套接字看成是 socket 和管道的混合体。

可以这么说,Unix 本地套接字的优势体现在它所使用的 API 几乎等同于网络 socket(客户/服务器)使用的 API,但是与客户端和服务端都在同一主机上的 TCP 相比,Unix 本地字节流套接字有性能上的优势。在单个主机,使用 Unix 域套接字来替代 Internet 域套接字是有好处的。

最后,总结一下:

  1. Socket 同样可以用于本地通信。
  2. 创建套接字时使用本地协议 AF_LOCAL
  3. 分为流式套接字(SOCK_STREAM)和数据报套接字(SOCK_DGRAM) 。
  4. 和其他进程间通信方式相比,Unix 本地套接字使用方便,效率也高 。因为它不需要经过网络协议栈、不需要打包拆包、不需要计算校验和、不需要维护序号和应答等、只是将应用层数据从一个进程拷贝到另一个进程…
  5. 常用于前后台进程通信,比如 X Window。
  6. 另外,Unix 本地套接字可用于传递文件描述符、传递用户凭证等场景。
评论 1 您还未登录,请先 登录 后发表或查看评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
©️2022 CSDN 皮肤主题:Age of Ai 设计师:meimeiellie 返回首页

打赏作者

阿基米东

你的鼓励将是我创作的最大动力

¥2 ¥4 ¥6 ¥10 ¥20
输入1-500的整数
余额支付 (余额:-- )
扫码支付
扫码支付:¥2
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、C币套餐、付费专栏及课程。

余额充值