【openGauss】谈谈openGauss中的raw类型

前言

在oracle数据库上进行开发的时候,经常会使用到raw类型,raw其实就是一段十六进制形式的二进制数据,最长长度和varchar2一致,都是32767个字节。在各种数据加解密或者数据传输时,使用二进制数据可以避免字符集异常或者特殊符号引起的程序运行错误。

在postgresql(截止到当前最新的14版本)中,没有raw类型,只能使用text或者bytea转换来处理,所以这个点可能会让迁移项目变得很头疼。

最近在写openGauss的兼容plsql包,正好写到了utl_raw,一开始我是完全按照postgresql中的bytea来写的,但后来突然发现在openGauss中有rawtohex和hextoraw两个函数,就去查了下,发现openGauss里竟然支持raw类型,而且还有一些raw类型的专用函数,就稍微研究了下(偶然发现目前openGauss官方文档内容比华为GaussDB官方文档内容要少,导致走了不少弯路)

官方文档

https://support.huaweicloud.com/devg-opengauss/opengauss_devg_0390.html

https://support.huaweicloud.com/devg-opengauss/opengauss_devg_0372.html

https://opengauss.org/zh/docs/2.1.0/docs/Developerguide/%E4%BA%8C%E8%BF%9B%E5%88%B6%E5%AD%97%E7%AC%A6%E4%B8%B2%E5%87%BD%E6%95%B0%E5%92%8C%E6%93%8D%E4%BD%9C%E7%AC%A6.html

文档这东西,看编写者的心思,可详细可简单,如果是要做研究,那还是结合看源码及实际测试来的好。
于是我先查了数据库里所有名称里带"raw"的函数,一共有18个,其中还有1个是重名的

select * from pg_proc h where h.proname like '%raw%'
pronameprolangprosrcprobin
bucketraw12bucketraw
hextoraw12texttoraw
rawcat12rawcat
rawcmp12rawcmp
raweq12raweq
rawge12rawge
rawgt12rawgt
rawin12rawin
rawle12rawle
rawlike12rawlike
rawlt12rawlt
rawne12rawne
rawnlike12rawnlike
rawout12rawout
rawrecv12bytearecv
rawsend12byteasend
rawtohex12rawtotext
rawtohex13rawtohex$libdir/plpgsql

然后对照华为GaussDB的官方文档来看,可以发现文档里,这些函数绝大部分都没写清楚功能及测试案例,比如下面这四个函数,文档里的描述写的竟然都是一样的
image.png

但好在大部分函数的命令是参考的基本运算符,所以能看懂个大概。
不过,绝对不能自以为是的以为这些函数的输出结果和你想的一样,稍不留神就会被坑了,所以我通过实际测试及结合看源代码,对这个函数列表整理了一份较为完整的说明,请重点留意下表中最后一列的注意事项

整理后的函数说明

pronameprosrc功能说明输入参数输出参数注意事项
hextorawtexttoraw将十六进制字符串转换成raw类型textrawselect hextoraw(‘abcd’)
rawtohexrawtotext将raw转换成十六进制字符串rawcstringselect rawtohex(‘FF1122335566778899’::raw)同名函数,注意参数类型的区别
rawtohexrawtohex将字符串转换成十六进制RAW字符串texttextselect rawtohex(‘FF1122335566778899’::text)同名函数,注意参数类型的区别,输出结果不一样,这个是字符串的二进制数据再转成raw
rawcatrawcat将两个raw按参数顺序从左至右拼成一个rawraw,rawrawselect rawcat(‘ab’,‘cd’)如果有多个值需要拼接,建议比较一些和管道符拼接的效率,实测,当拼接值很多的时候,管道符拼接的效率可能更高
rawcmprawcmp先将两个raw按照较短的截至同样长度(字节长度),然后转换成十进制数字再相减得到的差raw,rawintselect rawcmp(‘ffff’,‘feff’),rawcmp(‘feff’,‘1’),rawcmp(‘1’,‘f’),rawcmp(‘FFF’,‘FF’),rawcmp(‘FFFF’,‘FF’)这个内置函数是用的C语言的memcmp进行的处理,获得的是差,注意和python的cmp函数的区别
raweqraweq判断两个raw是否相等raw,rawboolselect raweq(‘ab’,‘aa’)
rawgerawge判断第一个raw是否大于或等于第二个rawraw,rawboolselect rawge(‘ab’,‘aa’)
rawgtrawgt判断第一个raw是否大于第二个rawraw,rawboolselect rawgt(‘ab’,‘aa’)
rawlerawle判断第一个raw是否小于或等于第二个rawraw,rawboolselect rawle(‘ab’,‘aa’)
rawltrawlt判断第一个raw是否小于第二个rawraw,rawboolselect rawlt(‘ab’,‘aa’)
rawnerawne判断两个raw是否不相等raw,rawboolselect rawne(‘ab’,‘aa’)
rawlikerawlike先把两个raw转成字符串,再看是否likeraw,rawboolselect rawlike(‘43616D65726F6E’::raw,‘4325’::raw)第二个参数里,需要将通配符(%_)及转移符(\)的二进制数据转换成raw类型,此例实际上相当于’Cameron’ like ‘C%’
rawnlikerawnlike先把两个raw转成字符串,再看是否 not likeraw,rawboolselect rawnlike(‘43616D65726F6E’::raw,‘4325’::raw)注意要进行和上面rawlike类似的处理
rawinrawin将raw字符串转换成bytea类型cstringbyteaselect rawin(‘43616D65726F6E’)注意这里的输入类型不是raw也不是text
rawoutrawout将bytea转换成raw字符串byteacstringselect rawout(‘C%’::BYTEA)注意返回的类型不是raw,而是raw的十六进制字符串,而且也不是TEXT类型
rawsendbyteasend将RAW转换成bytea类型rawbyteaselect rawsend(‘43616D65726F6E’)和rawin一样的功能但输入参数类型不一样
rawrecvbytearecv将一个外部二进制数据转换成rawinternalraw这个bytearecv在官方文档里没有介绍,属于pg的函数,但pg官方文档里同样没有介绍,不过根据源码可以得知功能
bucketrawbucketraw计算raw参数的hash值raw,intintselect bucketraw(‘FF’,1)第二个参数表示数据分布方式,0表示hash分布。单节点模式无法使用此函数

其他

对于以上函数,还要注意的有以下几点

  1. 在存储过程中,cstring类型需要显式的转换成text才能输出,比如 参数::text
  2. raw和text之间可以直接显式转换 ,比如 参数::raw,参数::text
  3. raw在内核中其实也是相当于bytea进行的处理,可以使用到c语言的内存指令操作,一般会比字符串要处理得快。
    但是如果不是用上述函数,而是用其他函数来处理raw,就会先隐式的转换成text再进行处理,这点尤其要注意,不仅执行效率会有变化,而且得到的结果可能会和预期不一致,比如使用length或substring函数时就和处理bytea类型时不一样
  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

DarkAthena

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值