字符集是一种定义字符编码的标准。它指定了字符和二进制数之间的对应关系。常见的字符集有ASCII、Unicode和UTF-8等。
ASCII(American Standard Code for Information Interchange)是最早的字符集之一,用于表示英语字符和一些特殊符号。它使用7位二进制数表示128个字符。
Unicode是一种全球字符集,它包含了各种语言的字符,以及一些特殊符号和符号。Unicode使用16位二进制数表示字符,可以容纳65536个字符。
UTF-8是一种Unicode的编码方式,它使用可变长度的编码,可以表示Unicode中的任意字符。UTF-8是目前最常用的字符编码方式,它兼容ASCII字符集,可以表示大多数字符,同时具有较好的可移植性。
ASCII字符集:只有英文、数字、符号等,占1个字节。
GBK字符集:汉字占2个字节,英文、数字占1个字节。
UTF-8字符集:汉字占3个字节,英文、数字占1个字节。
注意:字符编码和解码时使用的字符集必须一致。