Java中的字符

字节定义:
它是计算机的数据存储单元,每个字节包括8个二进制"位-bit",可以保存8位的二进制数。

字符集Charset定义:
为了实现对字符信息的存储,人们将可能用到的字符排成一个有序的字符队列,这种由多个有序字符组成的集合称为"字符集-Charset",而在计算机中实际保存的是字符在字符集中的序号,即一个二进制形式的整数。而到底采用1个还是多个字节以及具体如何来存储一个字符集的字符,这种相关的规定被称为"编码-Encoding"

字符定义:
计算机内存和硬盘等存储空间的管理都是以字节为基本单位,每个字节都有自己的编号,
而"字符-Char"是人们用作标记的符号,如’A’、'一’等,每个字符都具有约定的抽象含义。一个字符具体占用几个字节是取决于所用的字符编码集。

字符编码常用的字符集编码:ASCII码字符编集编码,非ASCII码字符集编码,GBK字符集编码,Unicode字符集编码,GB2312字符集编码,UTF-8字符集编码,UTF-16字符集编码,iso8859-1编字符集编码。

采用不同的字符编码集,1个字符所占用的字节数是各不不同的。
1)在Unicode字符集中,1个字符占用2个字节,1个中文或英文字符占用2个字节。
2)GB2312字符集或GBK字符集中,1个英文字母字符占用1个字节,1个汉字字符占用2个字节。
3)在UTF-8字符集中,1个英文字母字符占用1个字节,1个汉字字符占用3到4个字节。
4)在UTF-16字符集中,1个英文字母字符占用2个字节,1个汉字字符占用3到4个字节(Unicode扩展区的一些汉字存储需要4个字节),在UTF-32字符集中,世界上任何字符的存储都需要4个字节。

字符常量定义:

  1. 用英文单引号括起来的单个字符,例如:‘a’、‘字’。这是最常见的声明字符形式。
  2. 用英文单引号括起来的十六进制字符代码值来表示单个字符。其格式为:‘uXXXX’,其中u是约定的前缀(u是unicode的第一个字母),而后面的XXXX位4位十六进制数,是该字符在unicode字符集中的序号。例如:‘uFFFF’,‘u000a’。

转义字符定义:
某些特殊的字符可以采用转义符来表示,如换行和制表符在源文件直接出现会被当做分隔符、而不是做字符常量来使用,因而分别使用’\n’和’\t’来转义。在Java中声明一个字符:char c = ‘一’; 即表示c是一个字符。

转义字符举例:
\n:换行符,unicode值为’u000a’
\t:制表符,unicode值为’u0009’
\r:回车符,unicode值为’u000d’
":双引号,unicode值为’u0022’
‘:单引号,unicode值为’u0027’
\:反斜杠,unicode值为’u005c’
\b:退格符,unicode值为’u0008’
\ddd ,三位八进制
\udddd 四位十六进制

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值