GBase 8a批量入库时建议排序吗？

最新推荐文章于 2023-12-20 11:06:20 发布

kaixin.1

最新推荐文章于 2023-12-20 11:06:20 发布

阅读量201

点赞数

文章标签：排序算法算法

本文链接：https://blog.csdn.net/zzzPQ/article/details/122978743

版权

如果是数据批量入库，且时间窗口允许，可以做全排序后入库。排序后至少有如下好处：
1.大多数情况下，压缩率会更高；相似数据都聚集了；
2.智能索引的过滤效果会更好，性能更高；相似数据聚集，智能索引直接过滤掉更多不需

要的数据，减少maybe的数据量，也就减少了数据解包扫描；

join查询场景下，如果join的列是有序的，也可以大幅度提升join的性能。

排序对于高并发短查询场景，如电信话单查询场景，有很好的性能提升效果。

如果做不到全局有序，阶段性有序也可以。如每天做一次排序。
还可以数据入库后再排序，

通过 gccli -c参数下发hint /*+ distribute_exec */，否则insert select order会将order给优化掉，任务insert select做order没意义。

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

kaixin.1

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

南大通用GBase8ampp数据库排序函数排序序号的介绍

数小熊猫的博客

08-23

4953

关于南大通运8ampp数据库的排序函数介绍 RANK OVER函数 RANK() OVER([PARTITION BY col_name1,col_name2,…] ORDER BY col_name1 [ASC/DESC], col_name2 [ASC/DESC],…) 功能描述：根据 ORDER BY 子句中表达式的值，从查询返回的每一行计算它们与其它行的相对位置。组内的数据按 ORD...

GBASE南大通用数据库 GBase 8a 性能调优方法--数据排序

最新发布

weixin_47390342的博客

01-10

498

数据在按某查询列进行排序后，则相同数据取值会集中存放在有限的数据包中，因此在以该列进行过滤时，利用智能索引命中的数据包会很少，不仅能降低IO量而且会提高压缩比。南大通用数据库的GBase 8a 大规模应用的电信行业中，通常按照手机号码进行查询，因此可按一定的时间间隔对数据按照手机号码进行排序，则在此时间范围内的手机号码有序，在进行查询时，便可通过智能索引特性提高查询性能。数据库使用中，定期的增量数据入库，在每次增量数据批量入库前先对批量数据做排序后入库，使数据库数据在局部范围内有序，提高读取速度。

参与评论您还未登录，请先登录后发表或查看评论

GBase8a数据排序优化

lbfk的专栏

03-29

298

数据在按某查询列进行排序后，则相同数据取值会集中存放在有限的数据包中，因此在以该列进行过滤时，利用智能索引命中的数据包会很少，不仅能降低IO量而且会提高压缩比。其最大好处是可以将智能索引的过滤效果发挥到最优，从而使整体查询性能大幅提升。建议在实际应用场景许可的前提下，将数据按照查询常用条件列进行排序。如在电信行业中，通常按照手机号码进行查询，因此可按一定的时间间隔对数据按照手机号码进行排序，则在此时间范围内的手机号码有序，在进行查询时，便可通过智能索引特性提高查询性能。 ...

gbase8s 数据库数据的导入和导出.doc

02-23

gbase8s 数据库数据的导入和导出.doc

将文件写到GBASE南大通用数据库

weixin_47390342的博客

12-20

435

要将一个文件写到GBASE南大通用数据库需要将文件转换为一个字节数组，然后将该字节数组作为一个 INSERT 语句的参数，通过 GBASE南大通用ADO.NET 将值写入到表中。注意：创建表完成后，需要确定GBASE南大通用数据库系统变量 max_allowed_packet的值，该变量决定能发送给 GBase 服务器的数据包（比如一行）大小。file_id：表主键，file_name：存储的文件名，file_size：存储文件的大小，数组中，并且把它插入到 file 表中。file：存储文件内容。

南大通用GBase 8a集群管理培训资料

09-18

1-GBase 8a MPP Cluster 产品介绍.pdf 2-GBase 8a MPP Cluster 安装部署.pdf 3-GBase 8a MPP Cluster 日常维护.pdf 4-GBase 8a MPP Cluster SQL指南.pdf 5-GBase 8a MPP Cluster 数据加载.pdf 6-GBase 8a MPP ...

GBASE8A的jdbc驱动

11-04

GBase 是南大通用数据技术有限公司推出的自主品牌的数据库产品，目前在国内数据库市场具有较高的品牌知名度。GBase系列产品包括：新型分析型数据库...目前这工驱动是GBASE8A的jdbc驱动，找了好久才找到的，亲测可用。

GBase 8a SQL参考手册

08-17

列出GBase 8a中的SQL保留字，帮助开发者避免在编写SQL语句时与这些关键字冲突。总之，GBase 8a SQL参考手册是开发和管理GBase 8a数据库的必备工具，它详细阐述了SQL语言在GBase 8a中的应用，确保用户能够高效地...

gbase8a单机免费版-8.6.2.zip

03-28

在本压缩包“gbase8a单机免费版-8.6.2.zip”中，包含的是GBase 8a的单机免费版本，适合个人学习和小型项目测试使用。用户可以从官方网站获取这个版本，以体验其功能和性能。 GBase 8a的主要特点和知识点包括： 1. ...

GBase8a数据库安装包,文档，驱动包.rar

05-10

这个压缩包“GBase8a数据库安装包,文档，驱动包.rar”包含了安装GBase 8a所需的主要组件以及相关的文档和驱动程序，特别是JDBC驱动，这对于Java开发者来说是非常关键的。 1. **GBase 8a数据库安装包**：这是安装...

GBase 8c 数据导入-gs_restore命令导入

TYD123013的博客

08-26

762

gs_restore是GBase 8c数据库提供的与gs_dump配套的导入工具。通过该工具，可将gs_dump导出的文件导入至数据库。gs_restore支持导入的文件格式包含自定义归档格式、目录归档格式和tar归档格式。如果未指定导入数据库，则创建包含重建数据库所需的SQL语句脚本，并将其写入至文件或者标准输出。如果指定了数据库，则数据将被导入到指定的数据库中。gs_restore工具在导入时，允许用户选择需要导入的内容，并支持在数据导入前对等待导入的内容进行排序。...

gbase集群加载入库与导出文件

wen‘s blog

05-17

6846

背景：常用加载与导出语句，与其他数据库基本无差，mark下脚本里的sql执行`cat /opt/script/gbase/gbase.txt` -Dstg_noas -vvv -f</opt/script/temp/test.sql用户密码通常写在gbase.txt中加载：load data infile 'ftp://user:pwd@ip/dir/*.gz' into table ta...

国产数据库---GBase8a按时间分区

u010682157的博客

11-28

1433

GBase 8a MPP Cluster系列产品从V95版本开始支持分区表功能，通过使用分区表，可有效提升查询性能、降低数据维护成本。 GBase 8a支持普通分区和子分区。目前常用的分区方法有range分区、list分区、key分区、hash分区。在实际生产环境中，经常会按照时间顺序将生产数据进行组织管理，常用年度，季度，日期作为数据切分的时间单位。此时可利用range分区或list分区对数据按照时间单位进行划分管理。示例1：按年度进行分区管理 Create table pt (d date,i in

GBase之数据导入

shihd的博客

04-08

7865

用法： load data infile '[远程数据文件]' into table [schema.表名] data format 3 fields terminated by '[字段分隔符]'; 示例： -- 将192.168.0.1机器(假设该机器开启了sftp,用户名/密码为root/root)上的data.txt文件载入到数据表gbase.data中，文件分隔符为0x1D load ...

gbase入库时过滤不需要的字段

wen‘s blog

07-13

1350

背景：接入一个文件有10列，但是有用的可能就4列，多的字段入库影响速度，又占用空间，gbase支持入库时过滤，如下。1.有一个表有2列。phone，imsi2.文件有4列，“|”分割3.执行入库命令load data infile 'ftp://noas:87HEBq@192.168。1.1/data/data/temp/test.txt' into table test.jiangwen_tes...

postgre数据库备份与恢复

啊dongdong的博客

08-30

2207

命令行执行数据备份： 1.输入备份命令 /opt/postgresql/pg96/bin/pg_dump -h ip地址 -U 用户名 -W -d 数据库名 -n 模式名 > /data/backup.dmp 2.输入数据库密码：password，开始导出数据库数据 3.输入恢复命令 /opt/postgresql/pg96/bin/psql -h ip地址 -U 用户名

GBase 8c 数据导入

qq_41614765的博客

04-25

480

GBase 8c 支持pg_dump工具，用于将一个数据库转储为纯文本文件或者是其它格式。用法如下： pg_dump [options]... [database_name] options一般选项： -f, --file=FILENAME output file or directory name -F, --format=c|d|t|p output file format (custom, directory, tar, plain text) -v, --verbose 详细...

GBase 8a 安装与操作指南

"GBase 8a 是一款由南大通用数据技术股份有限公司开发的分析型数据管理系统，本文档详细介绍了GBase 8a在Linux RHEL 6平台上的安装步骤和基本操作方法。该安装手册包含了版权信息、免责声明、系统要求以及一系列的...