java utf8转iso8859-1_在Java中将UTF-8转换为ISO-8859-1-如何使其保持为单字节

最新推荐文章于 2023-12-07 06:47:25 发布

华之川

最新推荐文章于 2023-12-07 06:47:25 发布

阅读量1.1k

点赞数

文章标签： java utf8转iso8859-1

本文链接：https://blog.csdn.net/weixin_33278498/article/details/114153857

版权

从一组使用UTF-8编码字符串的字节开始，从该数据创建一个字符串，然后获得一些字节以不同的编码方式对该字符串进行编码：

byte[] utf8bytes = { (byte)0xc3, (byte)0xa2, 0x61, 0x62, 0x63, 0x64 };

Charset utf8charset = Charset.forName("UTF-8");

Charset iso88591charset = Charset.forName("ISO-8859-1");

String string = new String ( utf8bytes, utf8charset );

System.out.println(string);

// "When I do a getbytes(encoding) and "

byte[] iso88591bytes = string.getBytes(iso88591charset);

for ( byte b : iso88591bytes )

System.out.printf("%02x ", b);

System.out.println();

// "then create a new string with the bytes in ISO-8859-1 encoding"

String string2 = new String ( iso88591bytes, iso88591charset );

// "I get a two different chars"

System.out.println(string2);

这将正确输出字符串和iso88591字节：

âabcd

e2 61 62 63 64

âabcd

因此，您的字节数组未与正确的编码配对：

String failString = new String ( utf8bytes, iso88591charset );

System.out.println(failString);

产出

Ã¢abcd

(或者，或者您只是将utf8字节写入文件并以iso88591在其他位置读取它们)

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

华之川

关注关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

java utf8转iso8859-1_Java字符编码处理(UTF-8/ISO-8859-1)之一 –读文本文件乱码问题 | 学步园...

weixin_35406812的博客

02-16

961

Java字符编码处理(UTF-8/ISO-8859-1) 之一 -- 读文本文件乱码问题当我们用java.io.Properties的load()方法读属性文件，一般会将字符编码成ISO-8859-1的字符串，如果文件的编码方式不是ISO-8859-1，那么读入的字符可能有乱码出现。比如文件是UTF-8编码的(这可以用System.getProperty("file.encoding")得到，这...

java中byte, iso-8859-1, UTF-8，乱码的根源

Ryan Miao的博客

06-26

5772

Post@https://ryan-miao.github.io背景还是多语言, 在项目中遇到本地环境和服务端环境不一致乱码的情形。因此需要搞清楚乱码产生的过程，来分析原因。获取多语言代码如下：private Map<String, String> getLocalizationContent(Locale locale) { ResourceBundle bundle = Resource

参与评论您还未登录，请先登录后发表或查看评论

JAVA字符编码：Unicode,ISO-8859-1,GBK,UTF-8编码及相互转换

03-02

JAVA字符编码：Unicode,ISO-8859-1,GBK,UTF-8编码及相互转换

java utf8转iso8859-1_在Java中将UTF-8转换为ISO-8859-1

weixin_34602954的博客

02-13

2428

小编典典我不确定标准库中是否有将执行此操作的规范化例程。我不认为标准的Unicode规范化程序会处理“智能”引号的转换-但不要引用我。明智的做法是转储ISO-8859-1并开始使用UTF-8。也就是说，可以将任何通常允许的Unicode代码点编码为HTML网页，编码为ISO-8859-1。您可以使用转义序列对它们进行编码，如下所示：public final class HtmlEncoder {p...

java 编码 UTF-8、ISO-8859-1、GBK 【转】

javazhuanzai的专栏

01-10

484

java 编码 utf-8、iso-8859-1、gbk java支持utf-8、iso-8859-1、gbk等各种字体编码,可笔者发现java中字体编码的问题仍难倒了不少程序员,网上虽然也有不少关于在java中如何正确显示中文的文章,但都不够全面,笔者特意总结如下。影响java中字体编码正确显示的有几个因素: 1)数据库的连接方式; 2)网页中使用的字体编码; 3)数据库里存放数据的字体编

中文乱码问题，utf-8与ISO-8859-1之间的转换

tanjie_123的专栏

07-28

6116

一、ISO-8859-1与utf-8之间的转换问题方法一： String old = "中文的"; String u8 = new String(old.getBytes("ISO-8859-1"),"utf-8"); 方法二： String str = "测试字符转换 hello word"; //默认环境，已是UTF-8编码 try { Stri

Java 中 char 和 Unicode、UTF-8、UTF-16、ASCII、GBK 的关系

最新发布

川峰的博客

12-07

741

关于这几种字符编码的关系，经过各种资料研究，总结如下图（请右键在新标签页打开查看或者下载后使用看图工具放大查看）：1[0-127]A1-F7A1-A9XX7F4～6HEX由于只规定了表示符号的二进制代码，却没有规定如何存储这个二进制代码。所以如何存储有不同的实现。而就是针对的不同存储方式的具体实现。0-1271282340000~FFFF注意：很多资料和文章中将 UTF-8 和 UTF-16 都称为定长编码，但实际上它们是可变长编码的，例如一个中文汉字用 UTF-8 表示的话，就需要 3 个字节。

ISO/IEC 10646、Unicode及UTF-16、UTF-8

weixin_34256074的博客

10-18

2105

2019独角兽企业重金招聘Python工程师标准>>> ...

黑马毕向东Java课程笔记（day19-11——19-22）IO字节流:字节流及其读取、字节流缓冲区、自定义字节流（读取）的缓冲区、读取键盘的输入、读取/写入转换流、流操作规律

LKJgdut的博客

09-23

400

1、字节流——File 字节流的介绍字符流：（一个字符2个字节16位） FileReader FileWriter。 BufferedReader BufferedWriter 字节流：（一个字节8位） InputStream（输入的都是读） OutputStream（输出的都是写）（这里以流为对象，流向内存输出数据，就是写内存；内存数据输入流，对于流，就是将内存的数据...

代码点与代码单元和Unicode相关的UTF

ZytheMoon的博客

01-21

1088

java字符串由char序列组成，char数据类型是一个采用UTF-16编码表示Unicode代码点的代码单元，大多数的常用Unicode字符使用一个代码单元就可以表示，而辅助字符需要一对代码单元来表示，length方法返回的是采用UTF-16编码表示的给定字符串所需要的代码单元的数量，要想得到真实的长度即代码点的数量可以调用xxx.codePointCount(0，xxx.length())方法

UTF-8 GBK ISO-8859-1编码

skyboy11yk的专栏

08-07

5875

iSO8859-1，通常叫做Latin-1。Latin-1包括了书写所有西方欧洲语言不可缺少的附加字符。而gb2312是标准中文字符集。 UTF-8 是 UNICODE 的一种变长字符编码，即 RFC 3629。简单的说——大字符集。可以解决多种语言文本显示问题，从而实现应用国际化和本地化。对系统来讲，UTF-8 编码可以通过屏蔽位和移位操作快速读写，排序更加容易。UTF-8 是字节顺序无

有关编码（GBK、utf-8、iso8859-1、）相互转换问题

Java_I_ove的博客

07-19

3168

这是我的第一篇博客，写的不好与不足的地方，请大家提出问题和意见，请大家支持。下面以一个典型的java例子讲述一下字符集编码之间的转换等。代码比较长，但简单明了。代码主要说明以下一些内容： 1.main1()方法：将”中文“二字以指定 package Test; public class TestB { static String zhongwen = "中文"; stat

java 字符编码转换

荷逸的博客

02-27

4850

字符编码是将字符转换为二进制数字的过程，用于计算机的输入、输出和存储。在Java中，字符编码是使用Java编程语言中的Unicode字符集进行处理的。Unicode字符集是一个标准的字符集，它为世界上的每个字符分配了一个唯一的编号，包括拉丁字母、汉字、日语假名等等。

GBK与UTF-8之间的转换

xwnxwn的专栏

03-09

2274

在很多论坛、网上经常有网友问“ 为什么我使用 new String(tmp.getBytes("ISO-8859-1"), "UTF-8") 或者 new String(tmp.getBytes("ISO-8859-1"), "GBK")可以得到正确的中文，但是使用 new String(tmp.getBytes("GBK"), "UTF-8") 却不能将GBK转换成UTF-8呢？” 参考前

Java 字符集编解码及乱码示例

mazhongjia的博客

03-26

940

一、各种编码简介 XXX 二、示例 2、实现功能将EndeCodeTest.txt文件内容读取出来，写入EndeCodeTest_out.txt文件 2.1 如果文件中全是英文，使用是iso-8859-1编码读取与写入是没问题的 package com.mzj.netty.ssy._09_nio._04_Charset; import java.io.File; import j...

iso-8859-1表示中文汉字