[url]http://riashanghai.com/zh-hant/node/95[/url]
参考标准: UTF 5.1
文字 编码区间 说明
拉丁 (Basic Latin & Latin-1) 0x0000 ~ 0x00FF 包含英文字母及符号(等同于ASCII + Extended ASCII)
汉语 (CJK Unified Ideographs) 0x4E00 ~ 0x9FCF 包含20,932个常用及非常用中文字
日文 0x3040 ~ 0x31FF Hiragana + Katakana + Katakana Phonetic Ext.
韩语 0xAC00 ~ 0xD7AF
0x1100 ~ 0x117F
0x3130 ~ 0x3187 Hangul Syllables
Hangul Jamo
Hangul Compatibility Jamo
GB2312: 为中国官方颁布的中文简体编码标准, 包含6,763个汉字, 覆盖了约99.75%的输入.
Big5: 为台湾香港的中文繁体编码标准.
GB2312, Big5与UTF码没有直接的转换方程式, 幸运的是几乎所有主流现代计算机语言都提供了转换功能.
获取文字之UTF码
AS: int(String.charCodeAt(x))
Java: char [Java的char即为UTF码]
UTF码运用
数据库: 如果数据库column为CHAR, VARCHAR or CLOB时, 其输入字符必需为拉丁; NATIONAL CHAR则支持其它文字;
UI: 自动探测语言, 选择合适字体及间距.
参考标准: UTF 5.1
文字 编码区间 说明
拉丁 (Basic Latin & Latin-1) 0x0000 ~ 0x00FF 包含英文字母及符号(等同于ASCII + Extended ASCII)
汉语 (CJK Unified Ideographs) 0x4E00 ~ 0x9FCF 包含20,932个常用及非常用中文字
日文 0x3040 ~ 0x31FF Hiragana + Katakana + Katakana Phonetic Ext.
韩语 0xAC00 ~ 0xD7AF
0x1100 ~ 0x117F
0x3130 ~ 0x3187 Hangul Syllables
Hangul Jamo
Hangul Compatibility Jamo
GB2312: 为中国官方颁布的中文简体编码标准, 包含6,763个汉字, 覆盖了约99.75%的输入.
Big5: 为台湾香港的中文繁体编码标准.
GB2312, Big5与UTF码没有直接的转换方程式, 幸运的是几乎所有主流现代计算机语言都提供了转换功能.
获取文字之UTF码
AS: int(String.charCodeAt(x))
Java: char [Java的char即为UTF码]
UTF码运用
数据库: 如果数据库column为CHAR, VARCHAR or CLOB时, 其输入字符必需为拉丁; NATIONAL CHAR则支持其它文字;
UI: 自动探测语言, 选择合适字体及间距.