阿里Java学习路线：阶段 1：Java语言基础－Java语言高级特性：第17章： IO操作深入：课时80：字符编码

最新推荐文章于 2023-05-13 06:44:00 发布

Kenny C

最新推荐文章于 2023-05-13 06:44:00 发布

阅读量76

点赞数

分类专栏：阿里Java学习路线

本文链接：https://blog.csdn.net/kenidi8215/article/details/109175987

版权

阿里Java学习路线专栏收录该内容

375 篇文章 17 订阅

订阅专栏

在计算机的世界里面只认0、1的数据，如果要想描述一些文字的编码就需要对这些二进制的数据进行组合，所以才有了现在可以看见的中文，但是在进行编码的时候如果要想正确显示出内容则一定需要有解码，所以编码和解码肯定要采用统一的标准，那么如果不统一的时候就会出现乱码。
那么在实际的开发之中对于常用的编码有如下几种：
GBK/GB2312：国际编码，可以描述中文信息，其中GB2312只描述简体中文，而GBK包含有简体中文与繁体中文；
ISO8859-1：国际通用编码，可以用其描述所有的字母信息，如果是像型文字则需要进行编码处理；
UNICODE：采用十六进制的方式存储，可以描述所有的文字信息；
UTF编码：像形文字部分使用十六进制编码，而普通的字母采用的是ISO8859-1编码，它的优势在于适合于快速的传输，节约带宽，也就成为了我们在开发之中首先的编码，主要使用“UTF-8”编码。
如果要想知道当前系统中支持的编码规则，则可以采用如下代码列出全部的本机属性：

范例：列出本机属性

package cn.mldn.demo;

public class JavaAPIDemo {
    public static void main(String[] args) throws Exception {
    	System.getProperties().list(System.out);;
    }
}

部分信息：
【文件路径分割符】file.separator=
【文件默认编码】file.encoding=UTF-8

也就是说如果现在什么都不设置的话，则采用的编码就是UTF-8

范例：编写程序

package cn.mldn.demo;

import java.io.File;
import java.io.FileOutputStream;
import java.io.OutputStream;

public class JavaAPIDemo {
    public static void main(String[] args) throws Exception {
    	OutputStream output = new FileOutputStream("D:" + File.separator + "mldn.txt");
    	output.write("中华人民共和国万岁".getBytes());
    	output.close();
    }
}

output.write("中华人民共和国万岁".getBytes("UTF-8"));

此时为默认的处理操作，不设置编码的时候就将采用默认的编码方式进行。

范例：强制性设置编码

package cn.mldn.demo;

import java.io.File;
import java.io.FileOutputStream;
import java.io.OutputStream;

public class JavaAPIDemo {
    public static void main(String[] args) throws Exception {
    	OutputStream output = new FileOutputStream("D:" + File.separator + "mldn.txt");
    	output.write("中华人民共和国万岁".getBytes("ISO8859-1"));
    	output.close();
    }
}

项目中出现的乱码问题就是编码和解码标准不统一，而最好的解决乱码的方式，所有的编码都使用UTF-8。

Kenny C

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
阿里Java学习路线：阶段 1：Java语言基础－Java语言高级特性：第17章： IO操作深入：课时80：字符编码

在计算机的世界里面只认0、1的数据，如果要想描述一些文字的编码就需要对这些二进制的数据进行组合，所以才有了现在可以看见的中文，但是在进行编码的时候如果要想正确显示出内容则一定需要有解码，所以编码和解码肯定要采用统一的标准，那么如果不统一的时候就会出现乱码。那么在实际的开发之中对于常用的编码有如下几种：GBK/GB2312：国际编码，可以描述中文信息，其中GB2312只描述简体中文，而GBK包含有简体中文与繁体中文；ISO8859-1：国际通用编码，可以用其描述所有的字母信息，如果是像型文字则需要进行编
复制链接

扫一扫

专栏目录