DolphinDB使用案例2:数据表分区

  • 关于分区,参见《数据库分区、分表、分库、分片》。

    数据表分区后,只是物理存储上分为不同的区,对于软件层面,代码处理的还是同一张表,代码不会因为分区而改变。

    当需要加载的表比系统内存大,就需要使用分区表。

    本文以btcusdt_1t.csv为例进行操作。决定分区数量的原则是:每个分区的大小不超过系统内存的四分之一。

  • 分区方式一:顺序分区

    分区方式:根据行的顺序,将btcusdt_1t.csv分成2区。

    # 构建分区数据库
    db = database("D:/DolphinDB/Data/seqdb", SEQ, 2) 
    # 将分区表并行载入
    btcusdt = loadTextEx(db, "btcusdt",,"D:/DolphinDB/Data/btcusdt_1t.csv")
    

    在这里插入图片描述

    1. database数据库创建函数
      database(directory, [partitionType], [partitionScheme], [locations])
      
      参数 意义 备注
      directory 保存数据库的目录地址 如果创建分布式文件系统中的数据库,以“dfs://”
      partitionType 六种分区类型 顺序分区(SEQ),范围分区(RANGE),哈希分区(HASH),数值分区(VALUE),列表分区(LIST)和组合分区(COMPO)
      partitionScheme 分区方案,描述分区是如何创建的 CHAR, SHORT, INT, DATE, MONTH, TIME, MINUTE, SECOND, DATETIME和SYMBOL
      locations 元组指定分区位置 元组中元素数量,应与分区类型、分区方案共同决定的分区数量相同。
      如果不指定,则所有分区属于当前节点

      分区类型与分区方案对应表:

      分区类型 分区符号 分区方案
      顺序分区 SEQ 整型标量。表示分区的数量。
      范围分区 RANGE 向量。 向量的任意两个相邻元素定义分区的范围。
      哈希分区 HASH 元组。第一个元素是分区列的数据类型,第二个元素是分区的数量。
      值分区 VALUE 向量。 向量的每个元素定义了一个分区。
      列表分区 LIST 向量。 向量的每个元素定义了一个分区。
      组合分区 COM
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值