在计算机的世界里面只认0、1的数据,如果要想描述一些文字的编码就需要对这些二进制的数据进行组合,所以才有了现在可以看见的中文,但是在进行编码的时候如果要想正确显示出内容则一定需要有解码,所以编码和解码肯定要采用统一的标准,那么如果不统一的时候就会出现乱码。
那么在实际的开发之中对于常用的编码有如下几种:
GBK/GB2312:国际编码,可以描述中文信息,其中GB2312只描述简体中文,而GBK包含有简体中文与繁体中文;
ISO8859-1:国际通用编码,可以用其描述所有的字母信息,如果是像型文字则需要进行编码处理;
UNICODE:采用十六进制的方式存储,可以描述所有的文字信息;
UTF编码:像形文字部分使用十六进制编码,而普通的字母采用的是ISO8859-1编码,它的优势在于适合于快速的传输,节约带宽,也就成为了我们在开发之中首先的编码,主要使用“UTF-8”编码。
如果要想知道当前系统中支持的编码规则,则可以采用如下代码列出全部的本机属性:
范例:列出本机属性
package cn.mldn.demo;
public class JavaAPIDemo {
public static void main(String[] args) throws Exception {
System.getProperties().list(System.out);;
}
}
部分信息:
【文件路径分割符】file.separator=
【文件默认编码】file.encoding=UTF-8
也就是说如果现在什么都不设置的话,则采用的编码就是UTF-8
范例:编写程序
package cn.mldn.demo;
import java.io.File;
import java.io.FileOutputStream;
import java.io.OutputStream;
public class JavaAPIDemo {
public static void main(String[] args) throws Exception {
OutputStream output = new FileOutputStream("D:" + File.separator + "mldn.txt");
output.write("中华人民共和国万岁".getBytes());
output.close();
}
}
output.write("中华人民共和国万岁".getBytes("UTF-8"));
此时为默认的处理操作,不设置编码的时候就将采用默认的编码方式进行。
范例:强制性设置编码
package cn.mldn.demo;
import java.io.File;
import java.io.FileOutputStream;
import java.io.OutputStream;
public class JavaAPIDemo {
public static void main(String[] args) throws Exception {
OutputStream output = new FileOutputStream("D:" + File.separator + "mldn.txt");
output.write("中华人民共和国万岁".getBytes("ISO8859-1"));
output.close();
}
}
项目中出现的乱码问题就是编码和解码标准不统一,而最好的解决乱码的方式,所有的编码都使用UTF-8。