postgresql COPY 二进制格式

  1. PGCOPY\n\377\r\n\0\0\0\0\0\0\0\0\0 , 后面一般是0,不是一定为0,参见postgresql文档。
  2. 尾 0xffff 两字节,16位。
  3. 中间, 两字节 列数n + n个field, 每个field为 4字节后面value的大小 + value。有多少条数据,中间重复多少次。
  4. 每个field对于数据库中的对应列的元素,都有哪些列是发起copy的时候指定的,参见文档,比如libpq部分,如果这个列对应的元素为空,那么field中的大小为 0xffffffff, 及4字节32位全1,然后后面不用加value了。
  5. 数组的表示方法,如果对应列为数组,比如smallint[],文档中要求看postgresql源码,可以看array_send的代码,整个field的 格式为 32位整个value部分的大小(和其他的field相同) + 32位数组维数(一维数组为1) + 32位的是否有null(没有为0否则1),+ 32位的元素类型 参考pg_type_d.h + 对于每个维度{ 32位维度的大小(5个元素一维数组为5) + 32位低边界(如果没有特殊处理,就是1)} + 对于每个元素{ 32位value大小+value,同样支持32位-1,即0xffffffff代表空}
  6. 自定义类型表示方法,和数组类似,要看代码,看record_send,整个field的 格式为 32位整个value部分的大小(和其他的field相同) + 32位成员数n + 对于每个成员{32位元素类型,参考pg_type_d.h + 32位value大小 + value,同样支持 32位 0xffffffff代表空}
  7. 注意事项,所有的地方都是bigendian 字节序。

pg_type_d.h 中可以找到的常见类型对应的数字代号:
smallint 21, integer 23, bigint 20, real 700, double precision 701, timestamp§ without time zone 1114, text 25, boolean 16

对于数组和自定义类型,二进制的方式也不快,这和二进制格式的负责性是相关的。包含了太多的校验信息。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值