说明
在 Java 开发中,最常见的编码类型有 ISO8859-1,GBK/GB2312,Unicode,UTF-8 等编码格式。
- ISO8859-1:属于单字节编码,只能表示0 ~ 255 的字符范围,主要应用于英文。
- GBK/GB2312:属于中文编码,专门用来表示汉字,是双字节编码。GBK 可以表示简体中文和繁体中文;GB2312 只能表示简体中文,GBK兼容GB2312。
- Unicode:Java 中使用此编码,是最标准的一种编码,使用十六进制编码,但是不兼容 ISO8859-1。
- UTF:UTF 兼容 ISO8859-1,同事可以用来表示所有的语言字符,UTF 编码是不定长度的,每个一个字符为 1 ~ 6个字节不等。一般在中文网页中使用此编码,可以节省空间。
获取本机的编码显示
通过 System 类,可以获取到系统的相关信息。
public class Demo {
public static void main(String[] args) {
// 输出系统相关的信息
System.getProperties().list(System.out);
// 获取系统默认编码
System.out.println( System.getProperty("file.encoding") ); // GBK
}
}
控制台输出:
由于控制台输出太多,截取一部分
-- listing properties --
java.runtime.name=Java(TM) SE Runtime Environment
sun.boot.library.path=D:\JDK\jdk1.8.0_91\jre\bin
java.vm.version=25.91-b15
java.vm.vendor=Oracle Corporation
java.vendor.url=http://java.oracle.com/
path.separator=;
java.vm.name=Java HotSpot(TM) 64-Bit Server VM
file.encoding.pkg=sun.io
user.script=
user.country=CN
sun.java.launcher=SUN_STANDARD
sun.os.patch.level=
java.vm.specification.name=Java Virtual Machine Specification
user.dir=E:\WorkspaceEclipse\java8Study
java.runtime.version=1.8.0_91-b15
java.awt.graphicsenv=sun.awt.Win32GraphicsEnvironment
java.endorsed.dirs=D:\JDK\jdk1.8.0_91\jre\lib\endorsed
os.arch=amd64
java.io.tmpdir=C:\Users\Wayfreem\AppData\Local\Temp\
line.separator=
通过流进行编码
import java.io.File;
import java.io.FileOutputStream;
import java.io.OutputStream;
public class Demo {
public static void main(String[] args) throws Exception {// 此处直接抛出错误
File file = new File("e:" + File.separator + "demo" + File.separator + "my.txt");
if (!file.getParentFile().exists()) {
file.getParentFile().mkdirs();
}
OutputStream out = new FileOutputStream(file);
// 不使用编码 out.write("使用流转换编码格式".getBytes());// 没有进行编码
out.write("使用流转换编码格式".getBytes("ISO8859-1"));// 进行编码
out.close();
}
}