char是按照字符存储的,不管英文还是中文,固定占用占用2个字节,用来储存Unicode字符。范围在0-65536。
unicode编码字符集中包含了汉字,所以,char型变量中当然可以存储汉字啦。不过,如果某个特殊的汉字没有
被包含在unicode编码字符集中,那么,这个char型变量中就不能存储这个特殊汉字。
如果用3个字节有很多不常用的字又占了很多不必要的存储空间,所以我们用2个字节而不是1个或者3个表示汉字的国际码。
补充说明:
1. unicode编码固定占用两个字节,所以,char类型的变量也是占用两个字节。Unicode(统一码、万国码、
单一码)是一种在计算机上使用的字符编码。它为每种语言中的每个字符设定了统一并且唯一的二进制编码,
以满足跨语言、跨平台进行文本转换、处理的要求。传统的编码方式存在的缺陷:
①在不同的编码方案下有可能对应不同的字母
②采用大字符集的语言其编码长度可能不同
目前的用于实用的 Unicode 版本对应于 UCS-2,使用16位的编码空间。也就是每个字符占用2个字节。
2. 不同的看编码占据字节数也不同:utf-32中文是4字节;
utf-8码的中文都是3字节的,字母是1字节,因为utf-8是变长编码;
而 gbk/gbk18030 中文是2字节的,英文是1个字节。
package com.vic.basictype;
public abstract class BasicType {
public double returnType(byte x ,double y) {
return (short)x/y*2;//返回类型为double
}
public static void main(String[] args) {
System.out.println((Integer)196==(Integer)196);
int[] arr = new int[25];
System.out.println(arr[24]);
//Long ; = 32;
Long L = 32L;
long l = 32;
//float f = 3.4;
float f = 3.4f;
double d = 3.4;
//Float f1 = 3.4;
Float f1 = 3.4f;
Double d1 = 3.4;
char c = '男';
char c1 ='a'+'b';
System.out.println(c1);
char m='a';// ——a。
char m1='a'+'b';// ——Ã。 //char类型相加,提升为int类型,输出对应的字符。注,在CMD.exe用输出结果是问题?,不同的编码输出显示不一样。Eclipse中须改成UTF-8。
int m2='a'+'b';// ——195。//195没有超出int范围,直接输出195。
//char m3='a'+b; ——报错。//因为b是一个赋值的变量。
char m4=197;// ——Ã。 //输出字符编码表中对应的字符。
//char m5='197';// ——报错。//因为有单引号,表示是字符,只允许放单个字符。
char m6='a'+1;// ——b。//提升为int,计算结果98对应的字符是b。
char m7='中'+'国';// ——42282。
System.out.println("m7:"+m7+"||(int)m7:"+(int)m7);
//char m8='中'+'国'+'国'+'国';// ——报错。int转char有损失。因为结果已经超出char类型的范围。
int m9='中'+'国'+'国'+'国';// ——86820
char m10='中'+1;// ——丮。//1是int,结果提升为int,输出对应的字符。
//char m11='中'+"国"; ——报错。String无法转换为char。
System.out.println('中'+"国");// ——中国。//没有变量附值的过程。String与任何字符用“+”相连,转换为String。
}
public abstract void abstracMethod();//抽明方法不可以有方法体{},含抽象方法的类必为抽象类,抽象类不一定含抽象方法
}