java里面字符集和Charset类

这里涉及两个概念:编码、解码。

编码(encode):把明文的字符序列转化成二进制的字节序列。

解码(decode):把二进制的字节序列转换成明文的字符序列。

java默认的使用Unicode字符集,但是有的操作系统不支持,所以当从操作系统读取到java程序的时候,就可能出现乱码的情况。

jdk1.4提供了Charset类来处理字节序列和字符序列之间的转换。Charset类是不可变类

Charset类提供了一个availiableCharset()静态方法来获取当前jdk支持的所有字符集。

常用的字符集:

GBK:简体中文。BIG5:繁体中文。ISO-8859-1:ISO拉丁字母表No.1,也叫ISO-LATIN-1.UTF-8:8位UCS转换格式。

知道了字符集的别名之后,就可以使用Charset的forName()方法,创建字符集对象。如下

Charset cs = Charset.forName("UTF-8");

获得Charset对象之后就可以调用该对象的newDecode()/newEncode()这两个方法返回CharsetDecoder/CharsetEncoder对象,这两个对象代表Chars的解码器和编码器。调用CharsetDecoder的decode方法就可以将字符序列字节序列转换成字符序列(ByteBuffer)->(CharBuffer),同理调用encode就可以将字符序列转换成字节序列

(CharBuffer)->(ByteBuffer).

(String)->(ByteBuffer)

在String类里面提供了一个getBytes(String charset)方法。该方法返回byte[],该方法同样可以将制定字符集转换成字节序列。

 

转载于:https://www.cnblogs.com/Mr-Qiang/p/5304839.html

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值