整理篇:字符编码与java中的相关类型

字符编码 (Character encoding)、 字集码 是把字符集中的字符编码为指定集合中某一对象(例如:比特模式、自然数序列、8位元组或者电脉冲),以便文本在计算机中存储和通过通信网络的传递。常见的例子包括将拉丁字母表编码成摩斯电码和ASCII。其中,ASCII将字母、数字和其它符号编号,并用7位元的二进制来表示这个整数。通常会额外使用一个扩充的位元,以便于以8位字节的方式存储。
现代编码模型将字符编码的概念分为:有哪些字符、它们的编号、这些编号如何编码成一系列的“码元”(有限大小的数字)以及最后这些单元如何组成八位字节流。区分这些概念的核心思想是建立一个能够用不同方法来编码的一个通用字符集。为了正确地表示这个模型需要更多比“字符集”和“字符编码”更为精确的术语表示。现代模型中所用的术语列在下面:
字符表(Character repertoire)是一个系统支持的所有抽象字符的集合。
编码字符集(CCS:Coded Character Set)是将字符集C中每个字符映射到一个非负整数N(称作码位),这个字符集及码位映射称为编码字符集。
字符编码表(CEF:Character Encoding Form)将编码字符集的非负整数值(即码位)转换成有限比特长度的整数值,以利于计算机系统使用固定比特长度的二进制形式表示该整数。
我们常见的如ASCII、UNICODE、GBK等,都能用以上定义来描述:把字符集中的字符,编码为指定集合中的某一对象。
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值