Java字符集之Charset,CharsetEncoder,CharsetDecoder
Java默认使用Unicode字符集,当java程序在非Unicode字符集的操作系统中与其他程序进行数据交换时可能会出现乱码的情况,这时就需要对交换的数据进行编码和解码。
Java提供Charset类来处理字节序列和字符序列之间的转换。
Charset类是不可变类,该类提供创建编码器和解码器的方法以及获取所支持的字符集方法。
1. SortedMap<String, Charset> availableCharsets():静态方法获取JDK所支持的所有字符集集合。
SortedMap<String,Charset> sortedmap = Charset.availableCharset();
System.out.println("****************当前JDK所支持的字符集********************");
for (var name : sortedmap.keySet()){
System.out.println(name + ": " +sortedmap.get(name));
}
2. Charset forName(String charsetname):静态方法,根据字符集别名返回对应的字符集Charset对象。
Charset ioscharset = Charset.forName("IOS-8859-1");
charset gbkcharset = Charset.forName("GBK");
3. CharBuffer decode(ByteBuffer bytedata):将字节序列转换为字符序列。
4. ByteBuffer encode(CharBuffer chardata):将字符序列编码为字节序列。
5. ByteBuffer encode(String strdata):将字符串编码为字节序列。
6. CharsetDecoder newDecoder():实例方法,返回CharsetDecoder对象,调用decode()方法把ByteBuffer序列解码为CharBuffer序列。
7. CharsetEncoder newEncoder():实例方法,返回CharsetEncoder对象,调用encode()方法把CharBuffer或String字符系列编码为ByteBuffet序列。
附:
String类提供了getBytes(String charsetname)方法也可以将字符串编码为byte[]类型的字节序列,该方法参数为对应字符集名称。