达梦数据库_LENGTH_IN_CHAR和CHARSET的影响情况

概念:LENGTH_IN_CHAR:VARCHAR 类型对象的长度是否以字符为单位。

1:是,设置为以字符为单位时,定义长度并非真正按照字符长度调整,而是将存储长度值按照理论字符长度进行放大。所以会出现实际可插入字符数超过定义长度的情况,这种情况也是允许的。同时,存储的字节长度 8188 上限仍然不变,也就是说,即使定义列长度为8188 字符,其实际能插入的字符串占用总字节长度仍然不能超过 8188;0:否,所有 VARCHAR 类型对象的长度以字节为单位。

概念:CHARSET/UNICODE_FLAG:字符集选项。0 代表 GB18030,1 代表UTF-8,2 代表韩文字符集 EUC-KR。

GB18030编码向下兼容GBK和GB2312,兼容的含义是不仅字符兼容,而且相同字符的编码也相同。

UTF-8是用以解决国际上字符的一种多字节编码,它对英文使用8位(即一个字节),中文使用24为(三个字节)来编码。

GB18030数字字母占1个字节,普通汉字占2个字节,部分繁体及少数民族文字占4字节,Unicode在达梦中采用UTF-8编码格式,欧洲的字母字符占1到2个字节,亚洲的大部分字符占3个字节,附加字符为4个字节。如果只存储中文和字母数字,一般来说GB18030更节省空间一些。

注这两个参数一般配合使用,CHARSET/UNICODE_FLAG一旦确定无法修改,需谨慎设置。

比如:UNICODE_FLAG=1、LENGTH_IN_CHAR=0 一个汉字占用三个字节,一个英文占用一个字节如图:

UNICODE_FLAG=1、LENGTH_IN_CHAR=1 一个汉字占三个字节,一个英文字母占一个字节,一个字符四个字节(即一个varchar单位占四个字节),可以存四个英文字母

UNICODE_FLAG=0、LENGTH_IN_CHAR=1 一个汉字占两个字节一个字符,一个英文字母占一个字节,一个字符可以存一个汉字或者两个英文字母。

UNICODE_FLAG=0、LENGTH_IN_CHAR=0 一个汉字占两个字节,一个英文字符占一个字节。一个汉字占用两个字节。

达梦社区地址:https://eco.dameng.com

  • 1
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值