Linux中一切皆可以看作是文件,通过把gpfdist外部表中的文件替换成管道,可以实现不落盘导入数据。
- 创建管道
通过mkfifo命令创建命名管道,作为写入和读取的文件,下图示例中第一个字符p表示该文件是管道文件。
- 开启gpfdist服务
- 建立外部表
外部表中需要指定文件的location,把location中的文件写成刚才创建的管道。
- 开启生产者与消费者线程
往该管道中写数据可以看作是生产者、数据库中读取数据可以看作是消费者。在实际代码实现中可以考虑使用双线程/进程来实现,二者在对方线程未触发前会阻塞。下面给出一个简单的实例。
pipedemo是一个格式化文本数据,内容如下:
将该文本重定向到管道中,在消费者消费前会阻塞:
数据库中触发入库操作:
入库结束后,刚才的生产者进程也结束。如果是消费者进程先触发,也会阻塞住,等待生产者进程生产数据。