[Blog Read] 字符集与编码

最新推荐文章于 2024-05-06 10:30:00 发布

小彼得

最新推荐文章于 2024-05-06 10:30:00 发布

阅读量676

点赞数

文章标签：编码

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/xiaodongrush/article/details/20528473

版权

Java字符编码根本原理 http://lavasoft.blog.51cto.com/62575/273608/

java的源文件：GBK，UTF-8，GB18030等

java的Class文件：Unicode（实际上是utf-16）

jvm内存中：Unicode，从外部文件，数据库或者网络读取到的字符串可能是非Unicode的，所以需要转化。互转的时候，要能够兼容，否则会出现乱码。

转化的方法：getBytes(String charsetName) String(byte[] bytes, String charsetName)

String.getBytes("XXX")时发生了什么 http://yueyemaitian.iteye.com/blog/468668

这个解释了下getBytes(String charsetName)和String(byte[] bytes, String charsetName)

编码字符集与Java －Java World乱码问题根源之所在 http://www.blogjava.net/ramon/archive/2006/09/24/71505.html

(精)字符集GBK和UTF8的区别说明 http://blog.itpub.net/55022/viewspace-713901

iso8859-1，单字节编码。
GB2312，双字节编码，只能编码简体字，兼容iso8859-1。
GBK，双字节编码，支持简体和繁体，兼容GB2312。
GB18030，变长编码，收录了所有Unicode3.1中的字符，包括中国少数民族字符，GBK不支持的韩文字符等等，也可以说是世界大多民族的文字符号都被收录在内。兼容GBK。

GBK,GB2312以及Unicode都既是字符集，也是编码方式，而UTF-8只是编码方式，并不是字符集
GBK编码中英文字符只占一个字节

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
[Blog Read] 字符集与编码

Java字符编码根本原理 http://lavasoft.blog.51cto.com/62575/273608/java的源文件：GBK，UTF-8，GB18030等java的Class文件：Unicode（实际上是utf-16）jvm内存中：Unicode，从外部文件，数据库或者网络读取到的字符串可能是非Unicode的，所以需要转化。互转的时候，要能够兼容，否则会出现乱码。
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。