原文链接:https://www.gbase.cn/community/post/4415
更多精彩内容尽在南大通用GBase技术社区,南大通用致力于成为用户最信赖的数据库产品供应商。
前文参考:
FTP文件服务器配置介绍
南大通用GBase 8a MPP Cluster数据加载FTP文件服务器配置介绍|GBASE社区|天津南大通用数据技术股份有限公司|GBASE-致力于成为用户最信赖的数据库产品供应商
HTTP文件服务器配置介绍
南大通用GBase 8a MPP Cluster数据加载HTTP文件服务器配置介绍|GBASE社区|天津南大通用数据技术股份有限公司|GBASE-致力于成为用户最信赖的数据库产品供应商
HDFS服务器配置介绍
南大通用GBase 8a MPP Cluster数据加载HDFS服务器配置介绍|GBASE社区|天津南大通用数据技术股份有限公司|GBASE-致力于成为用户最信赖的数据库产品供应商
SFTP服务器配置介绍
https://www.gbase.cn/community/post/4409
今天给大家介绍下GBFS专用文件服务器配置,以及加载状态监控方法。
1 GBFS专用文件服务器介绍
GBFS专用文件服务器,是一款专门用于GBase 8a MPP Cluster数据库数据加载的二进制可执行程序。
通常以gbfs-9.5.3.22-redhat7.3.tar.bz2文件包的形式提供给用户,用户只需要使用以下命令将该压缩包解压,然后运行即可。
以gbfs-9.5.3.22-redhat7.3.tar.bz2为例进行说明:
# tar xvf gbfs-9.5.3.22-redhat7.3.tar.bz2
解压完成后,会在当前目录生成gbfs文件夹,文件夹内包括gbfs主程序以及BUILDINFO(编译信息),使用gbfs -?命令可能查看gbfs程序的帮助信息。
[root@rhel73-1 gbfs]# ./gbfs -?
./gbfs ver 9.5.3.22.126635 for unknown-linux-gnu on x86_64
Copyright 2004-2021 General Data Technology Co.Ltd.
GBase File Server
Usage: ./gbfs [OPTIONS]
-V, --version Get version info.
-?, --help Get help info.
-P, --port Port number to use for connection or 6666 for default,
valid range: [1025,65535] order of preference.
-H, --home-dir The GBase file server home dir, default: current user home dir.
-L, --log-dir The GBase file server logs dir, default: /tmp/.
帮助信息中,包括gbfs的版本信息,以及使用方法的简介。参数介绍如下:
-P & --port 是gbfs专用服务器工作时监听的端口号。默认是6666。
-H & --home-dir 是gbfs工作时的HOME目录,类似于FTP的HOME目录功能,默认是当前启动用户的HOME目录,这个参数主要用于gbfs的相对路径功能的支持。
例如:
以gbase用户运行。那么gbfs的默认HOME目录就是:/home/gbase/, 如果用户数据存放于/home/gbase/data/下。用户就可能直接使用以下URL加载文件。
gbfs://192.168.146.20/data/test.tbl
与之相对的绝对路径的URL如下所示:
gbfs://192.168.146.20//home/gbase/data/test.tbl
用户可以根据实际场景,对该参数进行配置。
-L & --log-dir 是gbfs的日志文件存储目录,gbfs启动后,会在该目录下新建gbfs_port.log。默认是在/tmp/目录下。
通常建议将gbfs专用文件服务器放至后台运行:
[gbase@rhel73-1 gbfs]$ ./gbfs &
[1] 23302
[gbase@rhel73-1 gbfs]$ IPv6 is available.
gbfs is ready for connections. home dir:/home/gbase/, log dir:/tmp/, port:6666.
示例:
加载位于GBFS服务器上的part.tbl文件,使用默认行分隔符和‘|’列分隔符。
gbase> load data infile 'gbfs://192.168.146.20//opt/ssbm/part.tbl' into table part data_format 3 FIELDS TERMINATED BY '|';
2 加载状态监控
功能说明
加载任务启动后,可以通过SQL方式查看本次加载任务的状态信息。
语法格式
SELECT * FROM information_schema.load_status;
图 :状态信息表中记录正在运行的所有加载任务的状态信息。
状态信息表各字段定义如下:
字段名称 | 含 义 说 明 |
SCN | SCN number |
DB_NAME | 库名 |
TB_NAME | 表名 |
IP | 加载机IP |
STATE | 加载状态 |
START_TIME | 加载启动时间 |
ELAPSED_TIME | 加载结束时间 |
AVG_SPEED | 加载速度 |
PROGRESS | 加载进度 |
TOTAL_SIZE | 文件总长度 |
LOADED_SIZE | 已加载数据量 |
LOADED_RECORDS | 已加载数据条数 |
SKIPPED_RECORDS | 跳过数据条数 |
DATA_SOURCE | 数据源 |
SQL_CMD | 加载任务的SQL |
以上就是今天的内容,感谢阅读!
原文链接:https://www.gbase.cn/community/post/4415
更多精彩内容尽在南大通用GBase技术社区,南大通用致力于成为用户最信赖的数据库产品供应商。