ISO8859-1:属于单字节编码,最多只能表示0~255的字符范围,主要在英文上的应用。
GBK/GB2312:中文的国标编码,专门用于表示汉字,是双字节编码,如果在此编码中出现中文,则使用ISO8859-1,GBK可以表示简体中文和繁体中文,而GB3212只能表示简体中文,GBK兼容GB2312。
Unicode:Java中使用此编码方式,是最标准的一种编码方式,使用十六进制表示编码。此编码不兼容ISO8859-1编码。
UTF:由于Unicode不支持ISO8859-1编码,而且容易占用更多的空间,而且对于英文字母也需要使用两个字节编码,这样使用Unicode不便于传输和存储,因此产生了UTF编码。UTF编码兼容了ISO8859-1编码,同时也可以用来表示所有的语言字符,不过UTF编码是不定长编码,每一个字符的长度为1-6个字节不等,一般在中文网页中使用此编码,可以节省空间。