java char型变量中能不能存储一个中文汉字?为什么?_Java的char型变量中能不能存贮一个中文汉字?为什么?...

彭河森

于 2021-02-24 19:15:24 发布

阅读量2.2k

点赞数 2

文章标签： java char型变量中能不能存储一个中文汉字?为什么?

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_31083901/article/details/114573433

版权

Java的char型变量中能不能存贮一个中文汉字?为什么?

java内部其实是使用的

UTF-16

的编码，所以是支持大部分非生僻汉字的。

上面那个文档的意思是说java不能支持世界上全部的文字，如果你用的字母不在这个

UTF-16

的标准里，那么程序会出错，所以你需要自己采用补增字符的方式解决。

不知道给出oracle官方连接那哥们写没写过这样的代码

public String getRandomChar(){

char[] arr = {'一','二','三','四'....};

......

return "" + arr[random1] + arr[random2] +arr[random3];

}

... main{

......

System.out.Println("请输入以下验证码"+ getRandomChar());

......

}

额外知识补充

unicode

并不是一个具体的字符集，而是一类标准。

其中包含好几种具体的字符集，有

定长，双字节表示一个字符的:

UTF-16

;

定长，四字节表示一个字符的：

UTF-32

;

不定长，1-4个字节表示一个字符的：

UTF-8

; (英语一般一个字节，汉字一般三个字节，特殊的生僻字四个字节)。

所以请不要一张嘴就说双字节不支持unicode编码。

不能, 因为历史原因, java char被定义为两个字节. 而表示 unicode 用两个字节是不够的. 表示所有的汉字需要两个char.

supplementary characters are defined by a pair of code point values that are called surrogates. The first code point is from the high surrogates range of U+D800 to U+DFBB, and the second code point is from the low surrogates range of U+DC00 to U+DFFF.

https://docs.oracle.com/javase/tutorial/…

https://docs.oracle.com/javase/tutorial/…

java的char可以存放两个字节，可以存储一个中文

char ch='汉';

System.out.println(ch);

像这样是可以的

首先大部分的汉字是可以用一个char表示的。

Unicode 好像是1994年正式公布那年头2个byte大概65536个字是够用的就是utf-16。

但计算机是全人类的，所以后来又加入了很多其他语言，于是2个byte不够用了。

后来就用4个byte表示。于是就有了utf-32但这货太大于是就有了utf-8，他本着能少用字节就少用的原则。

而java在1.5以后也发现了这个问题所以有些字符必须用俩个char表示.

链接描述

关注

2
点赞
踩
7

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。