目录
简介
Character 类用于对单个字符进行操作。
Character 类在对象中包装一个基本类型 char 的值
注释里详细地讲了java中char,代码点,代码单元的关系
16 位unicode编码的所有 65,536 个字符并不能完全表示全世界所有正在使用或曾经使用的字符。于是,Unicode 标准已扩展到包含多达 1,112,064 个字符。那些超出原来的16 位限制的字符被称作增补字符。Java的char类型是固定16bits的。代码点在U+0000 — U+FFFF之内到是可以用一个char完整的表示出一个字符。但代码点在U+FFFF之外的,一个char无论如何无法表示一个完整字符。这样用char类型来获取字符串中的那些代码点在U+FFFF之外的字符就会出现问题。
增补字符是代码点在 U+10000 至 U+10FFFF 范围之间的字符,也就是那些使用原始的 Unicode 的 16 位设计无法表示的字符。从 U+0000 至 U+FFFF 之间的字符集有时候被称为基本多语言面 (BMP UBasic Multilingual Plane )。因此,每一个 Unicode 字符要么属于 BMP,要么属于增补字符。
/**
* <p>Charactre类包装了原始类型char的值到一个对象。
* 一个Character类的对象包含了一个单独的字段,类型为char。
*
* <p>此外,这个类提供了几个方法,包括确定一个字符的种类(小写字符,数字,等等),
* 将字符从大写转换为小写,反之亦然。
*
* <p>字符信息基于版本6.2.0的Unicode标准
*
* <p>Character类的方法和数据由Unicode协会维护的Unicode字符数据库
* 的一部分UnicodeData文件的信息定义。
* 这个文件为每个定义的Unicode编码点或者字符范围,指定包括名字和通用类别的属性。
*
* <p>这个文件及其描述能从Unicode协会获得:http://www.unicode.org
*
* <p>char数据类型(Character对象封装的值)是基于原始Unicode规范,
* 它定义字符是固定长度的16bit的实体。
* Unicode标准后来出现了变化,允许出现超过16位的字符。
* 合法的代码点的范围是在U+0000到U+10FFFF,成为Unicode标量值。(请参考Unicode标准中U+n符号的定义。)
*
* <p&