定义:CharSet是对java nio编码解码的解决方案,专门负责字符的编码和解码。
编码:字符数组、字符串 ===> 字节数组。
解码:字节数组 ==> 字符数组、字符串
API详解
获取CharSet的API:
//创建一个charSet,传入字符集名称 比如utf-8
public static Charset forName(String charsetName)//返回一个默认字符集的charset,UTF-8
public static Charset defaultCharset()
编码解码API://解码,把字节缓冲区解码成字符缓冲区。
public final CharBuffer decode(ByteBuffer bb)//编码。把字符缓冲区编码成字节缓冲区。
public final ByteBuffer encode(CharBuffer cb)//编码。把字符串编码成字节缓冲区。
public final ByteBuffer encode(String str)//返回一个解码器,用于专门进行解码。提供更多的功能。
public abstract CharsetDecoder newDecoder();//返回一个编码器,用于专门进行编码。提供更多的功能。
public abstract CharsetEncoder newEncoder();
Demo
public static void testEnCodeDeCode(){
Charset UTF8CharSet = Charset.forName("utf-8");
Charset GBKCharSet = Charset.forName("gbk");
String content = "我贼帅!!";
ByteBuffer byteBuffer = UTF8CharSet.encode(content);
//用同样的字符集进行解码,不会乱码
System.out.println("=================>>>UTF8CharSet encode, UTF8CharSet decode<<<====================");
System.out.println(new String(UTF8CharSet.decode(byteBuffer).array()));
byteBuffer.clear();
//用不一样的字符集进行解码,乱码
System.out.println("=================>>>UTF8CharSet encode, GBKCharSet decode<<<====================");
System.out.println(new String(GBKCharSet.decode(byteBuffer).array()));
}
注意:编码与解码要用一样的字符集,不然会造成乱码。
如果只是进行简单的编码解码,无需使用专用的编码器和解码器,在Charset中完成就好。
其他API
//返回字符集的名字
public final String name()
//返回字符集的名字,与name()一样的效果。
public String displayName()
//返回是否支持传入参数charsetName代表的字符集
public static boolean isSupported(String charsetName)
//返回此字符集是否注册在 http://www.iana.org/assignments/character-sets IANA字符集注册表中。
public final boolean isRegistered();
//返回此字符集的别名的set集合。
public final Set<String> aliases()
//返回可用的字符集的集合。返回一个SortedMap结构,键是字符集名称,值是代表字符集的CharSet对象。
public static SortedMap<String,Charset> availableCharsets()
//判断两个字符集是否相等,0相等,返回非零不相等,其实就是比较字符集的名字。忽略大小写。
public final int compareTo(Charset that)
//返回此字符集是否支持编码。
public boolean canEncode()