ISO8859-1(Latin-1)
属于单字节编码,最多能表示的字符范围是0-255,应用于英文系列
ANSI:
使用2个字节来代表一个字符的各种汉字延伸编码方式,称为ANSI编码
在简体中文系统下,ANSI 编码代表 GB2312 编码
不同 ANSI 编码之间互不兼容
ASCII(ISO-646)
一个ASCII码值占一个字节(8个二进制位),其最高位(b7)用作奇偶校验位。
unicode对应于ucs-2,好像是现在是等于了
定长,2个字节
相对于iso8859-1编码来说,uniocode编码只是在前面增加了一个0字节,比如字母a为"00 61"
不兼容iso8859-1编码的,也不兼容任何编码
ucs-4
目前是在UCS-2前加上2个全零的byte。
定长,4个字节
utf-8/utf-7/utf-16
变长,英文字母都是用一个字节表示,而汉字使用三个字节
cp935、cp936
gbk/gb2312/GB18030
gbk编码能够用来同时表示繁体字和简体字,而gb2312只能表示简体字,gbk是兼容gb2312编码的
不是定长编码,汉字双字节编码,而英文字母和iso8859-1一致(兼容iso8859-1编码)。
mysql数据库
建库:default-character-set=utf8
连接:useUnicode=true&characterEncoding=UTF-8(现在不需要了)