java 字符长度中文_新手请教Java中关于字符长度的问题?

最新推荐文章于 2024-06-29 03:22:52 发布

weixin_39789979

最新推荐文章于 2024-06-29 03:22:52 发布

阅读量767

点赞数

文章标签： java 字符长度中文

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_39789979/article/details/114055011

版权

本文探讨了Java中Unicode编码的使用，指出无论是中文还是英文字符，在Java中每个字符都占据两个字节。在.java源文件中，ASCII字符占一个字节，而UTF-8编码的中文字符可能占3到4个字节。在内存中，Unicode编码确保了字符的一致处理，而在磁盘上的.java文件则依据不同的编码格式有不同的存储方式。

摘要由CSDN通过智能技术生成

1、JAVA中采用 Unicode编码 [ unicode编码一般是采用UCS-2规范双字节编码] ， java中每个字符占两个字节 (不管是中文字符，还是英文字符 1char = 2 byte )。 ----此处指的是编译过后的 .class文件中存储+jvm加载运行的规则。

在 .java文件中指定的各种编码格式，无论指定成哪种格式，最后在编译成.class时统统经过了unicode 编码转换成双字节在 JVM中运行时，虚拟机操作字符就容易的多了！存储占用字节数如上所述。

--------------------------------分隔符-----------------------------------------------------------

而 .java 源文件：

每个字节占 8bit ascii码表中 0-256 中具体表示的内容可以自行补脑。

一个英文数字各种标点字符在ASCII 表码中都有对应的值用一个字节即可表示，高位全部补0 (补0充数)。

--------------------------------分隔符-----------------------------------------------------------

.java文件中中文字符指定编码格式 UTF-8，这个编码格式是一个可变长度的范围1-4个字节。如果指定中文字符编码为UTF-8则占3~4个字节。不要让这个干扰你理解 unicode 编码，其实无关[一个在内存中，一个在磁盘中 orz .....]。

一般不设置字符编码格式 [默认系统编码格式] 或者编码格式为 gbk 一般一个中文占2个字节。

最后举个栗子：

------------------具体查看编译文件 .class 文件中 unicode编码格式存储的值 ------------

char i ='中'; // char 类型一个中文字符或者英文字符， char类型都占 2个字节。

StringBuffer unicode =new StringBuffer("\\u");

unicode.append(Integer.toHexString(i));

System.out.println(unicode.toString()); // "中" ---在java内部对应的 unicode值为 \u4e2d

\u4e2d 值可以通过网上搜站长工具有 unicode 与中文转换查询对应中文值验证。

\u表示是Unicode字符。后面是具体的值。

unicode 是双字节即一个字符占2个字节。这是 Unicode的编码规范不是java决定的...不要纠结了。

-------- 源文件 .java的编码格式举例如下----------

System.out.println(System.getProperty("file.encoding")); //文件编码格式

System.out.println("中".getBytes("gbk").length); // 长度为2个字节

System.out.println("中".getBytes("utf-8").length);//长度为3个字节

System.out.println("B".getBytes().length);//长度为1个字节

System.out.println("?".getBytes("utf-8").length);//长度为1个字节

weixin_39789979

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。