记得我曾经在开发form的时候犯过这样一个错误,对于form中的某个字段,对应于数据库中某张表的字段,假设在数据库中这个字段一般也就用到20个汉字的长度,后来我在开发form的时候,设置item类型长度的时候,我惯性的设置成了50byte,想着就算是20个汉字,最多也就占40个byte长度嘛。可是,就因为这一个想当然,结果出现错误了,后来发现数据库字符集编码是utf8,那么应该设置为60。从那以后,每次涉及到给字段设置长度的时候,我都会特别注意下,到底是啥编码。
在oracle中,比较常见的可能是length、substr,至少我看到的大部分都是这两个,要不是昨天看代码发现了lengthb、substrb,估计我也遗忘了。length表示的是字符串的字符长度,lengthb表示的是字符串的字节长度;substr表示根据字符长度获取子串,substrb表示根据字节长度来获取字串。下面直接看例子来说明:
SELECT length('叶德华abc') -- length按字符计,汉字、英文、数字都是1个字符,故这里返回6
FROM dual;
SELECT lengthb('叶德华abc') -- length按字节计,我这里是UTF-8编码,汉字3个字节,英文一个字节,故这里返回12
FROM dual;
SELECT substr('叶德华abc', -- substr按字符截取,截取到a,返回:叶德华a
1,
4)
FROM dual;
SELECT substrb('叶德华abc',
1,
2) -- substrb按字节截取,2不足一个汉字长度,返回:两个空格
FROM dual;
SELECT substrb('叶德华abc',
1,
3) -- substrb按字节截取,3刚好是一个汉字长度,返回:叶
FROM dual;
SELECT substrb('叶德华abc',
1,
4) -- substrb按字节截取,4多余一个汉字少于两个汉字,返回:叶 加一个空格
FROM dual;
在oracle中应该还有其他类似的方法,这里就不总结了,大概就是这么个意思。补充一下,据说在oracle中定义字符类型的时候默认的长度是byte,比如varchar2(20)表示的是20个字节长度,如果要定义成字符,则varchar2(20 char),不过,一般我们也都用字节定义。
具体说明如下:
LENGTH(string1) 返回以字符为单位的长度.
LENGTHB(string1) 返回以字节为单位的长度.
LENGTHC(string1) 返回以Unicode完全字符为单位的长度.
LENGTH2(string1) 返回以UCS2代码点为单位的长度.
LENGTH4(string1) 返回以UCS4代码点为单位的长度.
在不同的数据库,LENGTHB得到的值可能会不一样。
如LENGTHB('哈’)在不同的数据库得到的值可能是2或3。
因为不同字符集,对汉字的编码是不一样的,
例如ZHS16GBK是两位,采用两个byte位来定义一个汉字。
而在UTF8,采用3个byte。(也有2位汉字的UTF8的可能性)
总之,lengthb的值和你当前数据库的字符集是有关的。
oracle中length()与lengthb()最大的区别在于:
SQL> select length('新春快乐') from dual;
LENGTH('新春快乐')
------------------
4
SQL> select lengthb('新春快乐') from dual;
LENGTHB('新春快乐')
-------------------
8
区别:length求得是字符长度,
lengthb求得是字节长度。
length返回的是字符数
lengthb返回的是字节数
汉字“月”在length时,返回的时1
而在lengthb时返回的时2
length指的是字符个数,lengthb指的是字节数。字符个数跟数据库字符集有很大关系。length和lengthb的参数都为varchar2型,因此length(sysdate)有一个隐式的类型转换,实际上等同于length(to_char(sysdate)),ORACLE安装好后默认的NLS_DATE_FORMAT参数值为DD-MON-RR,结果就相当于length('28-9月 -05')和
lengthb('28-9月 -05')了,其结果就是9和10
在oracle中,比较常见的可能是length、substr,至少我看到的大部分都是这两个,要不是昨天看代码发现了lengthb、substrb,估计我也遗忘了。length表示的是字符串的字符长度,lengthb表示的是字符串的字节长度;substr表示根据字符长度获取子串,substrb表示根据字节长度来获取字串。下面直接看例子来说明:
SELECT length('叶德华abc') -- length按字符计,汉字、英文、数字都是1个字符,故这里返回6
FROM dual;
SELECT lengthb('叶德华abc') -- length按字节计,我这里是UTF-8编码,汉字3个字节,英文一个字节,故这里返回12
FROM dual;
SELECT substr('叶德华abc', -- substr按字符截取,截取到a,返回:叶德华a
1,
4)
FROM dual;
SELECT substrb('叶德华abc',
1,
2) -- substrb按字节截取,2不足一个汉字长度,返回:两个空格
FROM dual;
SELECT substrb('叶德华abc',
1,
3) -- substrb按字节截取,3刚好是一个汉字长度,返回:叶
FROM dual;
SELECT substrb('叶德华abc',
1,
4) -- substrb按字节截取,4多余一个汉字少于两个汉字,返回:叶 加一个空格
FROM dual;
在oracle中应该还有其他类似的方法,这里就不总结了,大概就是这么个意思。补充一下,据说在oracle中定义字符类型的时候默认的长度是byte,比如varchar2(20)表示的是20个字节长度,如果要定义成字符,则varchar2(20 char),不过,一般我们也都用字节定义。
具体说明如下:
LENGTH(string1) 返回以字符为单位的长度.
LENGTHB(string1) 返回以字节为单位的长度.
LENGTHC(string1) 返回以Unicode完全字符为单位的长度.
LENGTH2(string1) 返回以UCS2代码点为单位的长度.
LENGTH4(string1) 返回以UCS4代码点为单位的长度.
在不同的数据库,LENGTHB得到的值可能会不一样。
如LENGTHB('哈’)在不同的数据库得到的值可能是2或3。
因为不同字符集,对汉字的编码是不一样的,
例如ZHS16GBK是两位,采用两个byte位来定义一个汉字。
而在UTF8,采用3个byte。(也有2位汉字的UTF8的可能性)
总之,lengthb的值和你当前数据库的字符集是有关的。
oracle中length()与lengthb()最大的区别在于:
SQL> select length('新春快乐') from dual;
LENGTH('新春快乐')
------------------
4
SQL> select lengthb('新春快乐') from dual;
LENGTHB('新春快乐')
-------------------
8
区别:length求得是字符长度,
lengthb求得是字节长度。
length返回的是字符数
lengthb返回的是字节数
汉字“月”在length时,返回的时1
而在lengthb时返回的时2
length指的是字符个数,lengthb指的是字节数。字符个数跟数据库字符集有很大关系。length和lengthb的参数都为varchar2型,因此length(sysdate)有一个隐式的类型转换,实际上等同于length(to_char(sysdate)),ORACLE安装好后默认的NLS_DATE_FORMAT参数值为DD-MON-RR,结果就相当于length('28-9月 -05')和
lengthb('28-9月 -05')了,其结果就是9和10