byte[] data = str.getBytes(String encoding)
// getBytes将内存中的字符串str编码为 encoding指定字符编码类型 的数据,存储在data数组中。
String str = new String(Byte[] data, String decoding)
// new String方法,将其他编码类型数据data,转化为字符串默认的GBK编码类型,decoding是data的字符编码类型。
常见字符类型:
GBK GB2312 UTF-8 UTF-16 ISO-8859-8 等
理解:
本人刚开始学习java,对java底层并不了解,以下内容可能与事实不符,读者需辩证的看待。
所谓编码问题,无非两个方面,显示时出现非预期的,烂七八糟的字符;读入和输出不同编码类型的数据(如打开读入各种编码类型的文件,向浏览器传输指定编码类型的数据)
字符串在java中默认的编码类型是GBK,也就是说我们写在程序中的字符串,会通过GBK字符集转化为二进制存储在计算机中。而程序执行过程中也会将程序中的字符串类型默认为GBK编码的数据处理(如向控制台输出时,程序将内存中要输出的那堆二进制数据,默认通过GBK字符集,映射为字符,显示在控制台。)
为了java程序的正常运行, 解决输出乱码问题,我们应当将其他类型数据通过new String转化为gbk类型,new String函数若不指定decoding,会将byte数组直接封装成字符串,而不会在意字符编码类型,故当byte数组数据并非GBK类型时,一定要在调用时指定decoding。
而当我们需要 其他类型的字符编码类型的数据 作为输出是,要通过getBytes得到不同类型的数据。