char可以存储汉字吗?为什么

char是按照字符存储的,不管英文还是中文,固定占用占用2个字节,用来储存Unicode字符。范围在0-65536。
unicode编码字符集中包含了汉字,所以,char型变量中当然可以存储汉字啦。不过,如果某个特殊的汉字没有
被包含在unicode编码字符集中,那么,这个char型变量中就不能存储这个特殊汉字。
如果用3个字节有很多不常用的字又占了很多不必要的存储空间,所以我们用2个字节而不是1个或者3个表示汉字的国际码。
补充说明:
1. unicode编码固定占用两个字节,所以,char类型的变量也是占用两个字节。Unicode(统一码、万国码、
单一码)是一种在计算机上使用的字符编码。它为每种语言中的每个字符设定了统一并且唯一的二进制编码,
以满足跨语言、跨平台进行文本转换、处理的要求。传统的编码方式存在的缺陷:
①在不同的编码方案下有可能对应不同的字母
②采用大字符集的语言其编码长度可能不同
目前的用于实用的 Unicode 版本对应于 UCS-2,使用16位的编码空间。也就是每个字符占用2个字节。
2. 不同的看编码占据字节数也不同:utf-32中文是4字节;
utf-8码的中文都是3字节的,字母是1字节,因为utf-8是变长编码;
而 gbk/gbk18030 中文是2字节的,英文是1个字节。

package com.vic.basictype;

public abstract class BasicType {
    public double  returnType(byte x ,double y) {
        return (short)x/y*2;//返回类型为double
    }

    public static void main(String[] args) {
        System.out.println((Integer)196==(Integer)196);
        int[] arr = new int[25];
        System.out.println(arr[24]);
        //Long ; = 32;
        Long L = 32L;
        long l = 32;
        //float f = 3.4;
        float f = 3.4f;
        double d = 3.4;
        //Float f1 = 3.4;
        Float f1 = 3.4f;
        Double d1 = 3.4;
        char c = '男';
        char c1 ='a'+'b';
        System.out.println(c1);
        char m='a';//  ——a。

        char m1='a'+'b';//  ——Ã。  //char类型相加,提升为int类型,输出对应的字符。注,在CMD.exe用输出结果是问题?,不同的编码输出显示不一样。Eclipse中须改成UTF-8。

        int m2='a'+'b';//   ——195。//195没有超出int范围,直接输出195。

        //char m3='a'+b;  ——报错。//因为b是一个赋值的变量。

        char m4=197;//  ——Ã。 //输出字符编码表中对应的字符。

        //char m5='197';//  ——报错。//因为有单引号,表示是字符,只允许放单个字符。

        char m6='a'+1;//  ——b。//提升为int,计算结果98对应的字符是b。

        char m7='中'+'国';//  ——42282。
        System.out.println("m7:"+m7+"||(int)m7:"+(int)m7);
        //char m8='中'+'国'+'国'+'国';//  ——报错。int转char有损失。因为结果已经超出char类型的范围。

        int m9='中'+'国'+'国'+'国';//  ——86820

        char m10='中'+1;//  ——丮。//1是int,结果提升为int,输出对应的字符。

        //char m11='中'+"国";  ——报错。String无法转换为char。

        System.out.println('中'+"国");//  ——中国。//没有变量附值的过程。String与任何字符用“+”相连,转换为String。

    }

    public abstract void abstracMethod();//抽明方法不可以有方法体{},含抽象方法的类必为抽象类,抽象类不一定含抽象方法

}
  • 10
    点赞
  • 29
    收藏
    觉得还不错? 一键收藏
  • 2
    评论
在使用`char name[10]`定义一个字符数组来存储中文时,需要注意以下几点: 1. 中文字符通常使用多个字节来表示,而一个`char`类型只能存储一个字节的数据。因此,一个长度为10的字符数组只能存储最多10个英文字符或数字,而不能存储10个中文字符。 2. 在使用`%s`格式化字符串读取中文字符串时,需要考虑字符编码的问题。如果输入的中文字符串使用的是UTF-8编码,那么每个中文字符需要用3个字节;如果使用GB2312编码,每个中文字符需要用2个字节。因此,如果你要读取一个长度为10的中文字符串,需要将字符数组定义为`char name[30]`(UTF-8编码)或`char name[20]`(GB2312编码),以便存储最多10个中文字符。 综上所述,虽然`char name[10]`可以存储中文字符,但它的存储空间非常有限,无法满足实际需求。如果需要存储中文字符串,建议使用`wchar_t`类型或者动态分配内的方式来存储。例如,可以使用以下方式定义一个能够存储任意长度中文字符串的字符数组: ```c #include <stdlib.h> #include <wchar.h> int main() { wchar_t* name = (wchar_t*)malloc(100 * sizeof(wchar_t)); wscanf(L"%ls", name); // ... free(name); return 0; } ``` 在上面的代码中,`wchar_t* name`表示一个指向`wchar_t`类型的指针,使用动态内分配函数`malloc`来分配100个`wchar_t`类型的空间。读入中文字符串时,使用`wscanf`函数和`%ls`格式化字符串。`%ls`表示读取一个`wchar_t`类型的字符串,并将其存储到指定的字符数组中。最后,使用`free`函数释放动态分配的内空间。
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值