本附录列出了KingbaseES支持的字符集、语言。
本附录包含以下主题:
6.1. KingbaseES支持的字符集 ¶
表"KingbaseES字符集"显示了KingbaseES字符集的支持情况。
名称 | 描述 | 语言 | 服务器端是否支持 | 是否支持ICU | 字节/字符 | 别名 |
---|---|---|---|---|---|---|
| BigFive | 繁体中文 | 否 | 否 | 1-2 |
|
| 扩展UNIX 编码-中国 | 简体中文 | 是 | 是 | 1-3 | |
| 扩展UNIX 编码-日本 | 日文 | 是 | 是 | 1-3 | |
| 扩展UNIX 编码-日本, JIS X 0213 | 日文 | 是 | 否 | 1-3 | |
| 扩展UNIX 编码-韩国 | 韩文 | 是 | 是 | 1-3 | |
| 扩展UNIX 编码-中国 | 繁体中文 | 是 | 是 | 1-3 | |
| 国家标准 | 中文 | 是 | 是 | 1-4 | |
| 扩展国家标准 | 简体中文 | 是 | 是 | 1-2 |
|
| ISO 8859-5, ECMA 113 | 拉丁语/ 西里尔语 | 是 | 是 | 1 | |
| ISO 8859-6, ECMA 114 | 拉丁语/ 阿拉伯语 | 是 | 是 | 1 | |
| ISO 8859-7, ECMA 118 | 拉丁语 /希腊语 | 是 | 是 | 1 | |
| ISO 8859-8, ECMA 121 | 拉丁语/ 希伯来语 | 是 | 是 | 1 | |
| JOHAB | 韩语 | 否 | 否 | 1-3 | |
| KOI8-R | 西里尔语 (俄语) | 是 | 是 | 1 |
|
| KOI8-U | 西里尔语 (乌克兰语) | 是 | 是 | 1 | |
| ISO 8859-1, ECMA 94 | 西欧 | 是 | 是 | 1 |
|
| ISO 8859-2, ECMA 94 | 中欧 | 是 | 是 | 1 |
|
| ISO 8859-3, ECMA 94 | 南欧 | 是 | 是 | 1 |
|
| ISO 8859-4, ECMA 94 | 北欧 | 是 | 是 | 1 |
|
| ISO 8859-9, ECMA 128 | 土耳其语 | 是 | 是 | 1 |
|
| ISO 8859-10, ECMA 144 | 日耳曼语 | 是 | 是 | 1 |
|
| ISO 8859-13 | 波罗的海 | 是 | 是 | 1 |
|
| ISO 8859-14 | 凯尔特语 | 是 | 是 | 1 |
|
| ISO 8859-15 | 带欧罗巴和 口音的LATIN1 | 是 | 是 | 1 |
|
| ISO 8859-16, ASRO SR14111 | 罗马 尼亚语 | 是 | 否 | 1 |
|
| Mule内部编码 | 多语种编辑器 | 是 | 否 | 1-4 | |
| Shift JIS | 日语 | 否 | 否 | 1-2 |
|
| Shift JIS, JIS X0213 | 日语 | 否 | 否 | 1-2 | |
| 未指定 | 任意 | 是 | 否 | 1 | |
| 统一韩语编码 | 韩语 | 否 | 否 | 1-2 |
|
| Unicode, 8-bit | 所有 | 是 | 是 | 1-4 |
|
| Windows CP866 | 西里尔语 | 是 | 是 | 1 |
|
| Windows CP874 | 泰语 | 是 | 否 | 1 | |
| Windows CP1250 | 中欧 | 是 | 是 | 1 | |
| Windows CP1251 | 西里尔语 | 是 | 是 | 1 |
|
| Windows CP1252 | 西欧 | 是 | 是 | 1 | |
| Windows CP1253 | 希腊语 | 是 | 是 | 1 | |
| Windows CP1254 | 土耳其语 | 是 | 是 | 1 | |
| Windows CP1255 | 希伯来语 | 是 | 是 | 1 | |
| Windows CP1256 | 阿拉伯语 | 是 | 是 | 1 | |
| Windows CP1257 | 波罗的海 | 是 | 是 | 1 | |
| Windows CP1258 | 越南语 | 是 | 是 | 1 |
|
注意
并非所有的客户端接口都支持以上字符集。如:JDBC 不支持 MULE_INTERNAL
、 LATIN6
、 LATIN8
和 LATIN10
。
SQL_ASCII
字符集的设置和其它字符集的设置差别很大。 如果您设置的字符集是 SQL_ASCII
,服务器根据ASCII标准解释在0-127范围内的字节,不能解析在128-255范围的字节。 如果您设置的字符集是 SQL_ASCII
,服务器不会进行编码转换,基于此, SQL_ASCII
不会用来做为编码的声明。 在大多数情况下,如果您使用了任何非ASCII数据,由于Kingbase不会转换或者校验费ASCII字符,建议您不把字符集设置为 SQL_ASCII
。
6.2. 服务器和客户端字符集转换 ¶
KingbaseES支持在服务器和客户端之间的一些编码的自动转换。 转换信息在系统目录 sys_conversion
中存储。 KingbaseES默认支持一些字符集之间的转换,如表"客户端/服务器字符集转换"。 您也可以使用SQL命令 CREATE CONVERSION
创建一个新的转换。
服务器字符集 | 可用的客户端字符集 |
---|---|
| 不支持作为一个服务器编码 |
| EUC_CN, |
| EUC_JP, |
| EUC_JIS_2004, |
| EUC_KR, |
| EUC_TW, |
| GB18030, |
| GBK, |
| ISO_8859_5, |
| ISO_8859_6, |
| ISO_8859_7, |
| ISO_8859_8, |
| 不支持作为服务端编码 |
| KOI8R, |
| KOI8U, |
| LATIN1, |
| LATIN2, |
| LATIN3, |
| LATIN4, |
| LATIN5, |
| LATIN6, |
| LATIN7, |
| LATIN8, |
| LATIN9, |
| LATIN10, |
| MULE_INTERNAL, |
| 不支持作为一个服务器编码 |
| 不支持作为一个服务器编码 |
| 任意(不会执行任何转换) |
| 不支持作为一个服务器编码 |
| 所有支持的编码 |
| WIN866, |
| WIN874, |
| WIN1250, |
| WIN1251, |
| WIN1252, |
| WIN1253, |
| WIN1254, |
| WIN1255, |
| WIN1256, |
| WIN1257, |
| WIN1258, |