CharsetDecoder 应该是您要寻找的东西,不是吗?
许多网络协议和文件使用面向字节的字符集(例如ISO-8859-1(ISO-Latin-1))存储其字符。
但是,Java的本机字符编码是统一码 UTF16BE(16位UCS转换格式,大端字节顺序)。
请参阅Charset。这并不意味着UTF16是默认字符集(即:默认“十六位Unicode代码单元的序列与字节序列之间的映射”):
Java虚拟机的每个实例都有一个默认字符集,它可以是也可以不是标准字符集之一。
[ US-ASCII,ISO-8859-1又名ISO-LATIN-1,UTF-8,UTF-16BE,UTF-16LE,UTF-16]
默认字符集的虚拟机的启动期间所确定,并且通常取决于语言环境和charset正在使用的底层操作系统。
此示例演示如何将a中的ISO-8859-1编码字节转换ByteBuffer为a中的字符串,CharBuffer反之亦然。
// Create the encoder and decoder for ISO-8859-1
Charset charset = Charset.forName("ISO-8859-1");
CharsetDecoder decoder = charset.newDecoder();
CharsetEncoder encoder = charset.newEncoder();
try {
// Convert a string to ISO-LATIN-1 bytes in a ByteBuffer
// The new ByteBuffer is ready to be read.
ByteBuffer bbuf = encoder.encode(CharBuffer.wrap("a string"));
// Convert ISO-LATIN-1 bytes in a ByteBuffer to a character ByteBuffer and then to a string.
// The new ByteBuffer is ready to be read.
CharBuffer cbuf = decoder.decode(bbuf);
String s = cbuf.toString();
} catch (CharacterCodingException e) {
}