Java中的字符编码

字符编码
    java.lang和java.io包中的许多构造函数和方法在进行8位字节和16位Unicode字符间转换时,都有一个指定所使用的字符编码字符串参数。字符编码由以下字符构成:
大写字母'A'到'Z' ('/u0041'到'/u005a'),
小写字母'a'到'z' ('/u0061'到'/u007a'),
数字'0'到'9' ('/u0030'到'/u0039'),
破折号'-' ('/u002d', 连接符-减号),
冒号':' ('/u003a', COLON), 
下划线 '_' ('/u005f', LOW LINE).
    编码名称必须由字母或数字开头,空串不是合法的编码名称。一个编码可能有多个名字,其中一个是他的规范名字。规范名称可以通过InputStreamReader和OutputStreamWriter类的getEncoding返回。关于更多字符编码信息可以参考协议文档RFC2278: IANA Charset Registration Procedures。
    每种Java平台的实现要求支持下面的字符编码。可以通过查阅发行文档来看支持那些字符编码:

US-ASCII     Seven-bit ASCII, a.k.a. ISO646-US, a.k.a. the Basic Latin block of the Unicode character set
ISO-8859-1   ISO Latin Alphabet No. 1, a.k.a. ISO-LATIN-1
UTF-8        Eight-bit Unicode Transformation Format
UTF-16BE     Sixteen-bit Unicode Transformation Format, big-endian byte order
UTF-16LE     Sixteen-bit Unicode Transformation Format, little-endian byte order
UTF-16       Sixteen-bit Unicode Transformation Format, byte order specified by a mandatory initial byte-order mark (either order accepted on input, big-endian used on output)

    每种Java虚拟机都有缺省的字符编码,缺省编码在虚拟机启动期间就确定了,这依赖于虚拟机下层的操作系统的字符编码。

    在调用方法时如果使用不被支持的字符编码,则会抛出UnsupportedEncodingException。如public String(byte[] bytes,   String enc)  throws UnsupportedEncodingException

 

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值