java字符串编码和解码

最新推荐文章于 2024-07-26 09:40:54 发布

梦是做出来的

最新推荐文章于 2024-07-26 09:40:54 发布

阅读量6.9k

点赞数 1

分类专栏： java String 文章标签：字符串乱码

本文链接：https://blog.csdn.net/weixin_39819880/article/details/89461847

版权

java 同时被 2 个专栏收录

30 篇文章 0 订阅

订阅专栏

String

2 篇文章 0 订阅

订阅专栏

java字符串编码和解码

记录原因：因为Windows和Linux操作系统默认编码的不同（ Windows的默认编码为GBK,Linux的默认编码为UTF-8），导致项目中出现了乱码问题，故此记录一下。

万变不离其宗，只要保证编码方式和解码方式统一，你就不可能出现乱码。
在这里插入图片描述
（代码中getBytes()默认系统编码获得是"utf-8"原因是我开发环境中设置的默认系统编码是“utf-8”！）

getBytes() 编码 new String(byte[], decode) 解码

与getBytes()相对的,通过new String(byte[], decode)的方式来还原。

但发现ISO8859-1编码再组合之后，无法还原“好”字呢，其实原因很简单，因为ISO8859-1编码的编码表中，根本就没有包含汉字字符，所以解码还原就无从谈起。

注意：

但有时候,为了让中文字符适应某些特殊要求(如httpheader要求其内容必须为iso8859-1编码),可能会通过将中文字符按照字节方式来编码的情况,如:

String s_iso88591 = newString(“好”.getBytes(“UTF-8”),“ISO8859-1”)

String s_utf8 = newString(s_iso88591.getBytes(“ISO8859-1”),“UTF-8”)


String s_iso88591 = newString("好".getBytes("UTF-8"),"ISO8859-1")     
第一步： "好".getBytes("UTF-8")：把"好"用utf-8编码取得字节
第二步： new String(xxx字节,""ISO8859-1"")：以"ISO8859-1"的编码生成字符串


String s_utf8 = newString(s_iso88591.getBytes("ISO8859-1"),"UTF-8")
第一步：s_iso88591.getBytes("UTF-8")：把s_iso88591用"ISO8859-1"编码取得字节
第二步：new String(xxx字节,"UTF-8")：以”UTF-8”的编码生成字符串