java 中String编码和byte 解码总结

最新推荐文章于 2024-02-22 22:22:45 发布

就叫二号人物

最新推荐文章于 2024-02-22 22:22:45 发布

阅读量355

点赞数

本文链接：https://blog.csdn.net/hffyfdt/article/details/86921445

版权

本文详细总结了Java中String与byte之间的编码解码过程，包括InputStreamReader和OutputStreamWriter在字节流与字符流之间的转换，以及String的getBytes()和String(byte[])构造方法的使用。还探讨了URLEncoder和URLDecoder在URL编码解码中的作用，并通过案例展示了不同编码（如UTF-8和GBK）在转换过程中的差异。最后，文章提到了在Android中处理字节数组转String时需要注意的编码问题，建议使用ISO-8859-1以保持字节数组不变。

摘要由CSDN通过智能技术生成

java 中String编码和byte 解码

http://wanxw2001.iteye.com/blog/1570339

1、InputStreamReader 是字节流通向字符流的桥梁：它使用指定的 charset 读取字节并将其解码为字符
InputStreamReader(InputStream in, String charsetName)

2、OutputStreamWriter 是字符流通向字节流的桥梁：可使用指定的 charset 将要写入流中的字符编码成字节。它使用的字符集可以由名称指定或显式给定，否则将接受平台默认的字符集。
OutputStreamWriter(OutputStream out, String charsetName)

3、String(byte[] bytes, Charset charset)
          通过使用指定的 charset解码指定的 byte数组，构造一个新的 String。

4、byte[] getBytes(Charset charset)
          把JVM内存中unicode形式的String按encoding制定的编码，转成字节流
          使用给定的 charset 将此 String 编码到 byte 序列，并将结果存储到新的 byte 数组。

5、URLEncoder。encode(String s, String enc)

        使用指定的编码机制将字符串转换为 application/x-www-form-urlencoded 格式。
        对 String 编码时，使用以下规则：

字母数字字符 "a" 到 "z"、"A" 到 "Z" 和 "0" 到 "9" 保持不变。
特殊字符 "."、"-"、"*" 和 "_" 保持不变。
空格字符 " " 转换为一个加号 "+"。
所有其他字符都是不安全的，因此首先使用一些编码机制将它们转换为一个或多个字节。然后每个字节用一个包含 3 个字符的字符串 "%xy" 表示，其中 xy 为该字节的两位十六进制表示形式。推荐的编码机制是 UTF-8。但是，出于兼容性考虑，如果未指定一种编码，则使用相应平台的默认编码。
例如，使用 UTF-8 编码机制，字符串 "The string ü@foo-bar" 将转换为 "The+string+%C3%BC%40foo-bar"，因为在 UTF-8 中，字符 ü 编码为两个字节，C3 （十六进制）和 BC （十六进制），字符 @ 编码为一个字节 40 （十六进制）。

6、URLDecoder.decode(String s, String enc)

        使用指定的编码机制对 application/x-www-form-urlencoded 字符串解码。
转换中使用以下规则：

字母数字字符 "a" 到 "z"、"A" 到 "Z" 和 "0" 到 "9" 保持不变。
特殊字符 "."、"-"、"*" 和 "_" 保持不变。
加号 "+" 转换为空格字符 " "。
将把 "%xy" 格式序列视为一个字节，其中 xy 为 8 位的两位十六进制表示形式。然后，所有连续包含一个或多个这些字节序列的子字符串，将被其编码可生成这些连续字节的字符所代替。可以指定对这些字符进行解码的编码机制，或者如果未指定的话，则使用平台的默认编码机制。
该解码器处理非法字符串有两种可能的方法。一种方法是不管该非法字符