Java字节流读取中文文本编码解码详解

最新推荐文章于 2025-03-19 21:36:19 发布

玊非玉

最新推荐文章于 2025-03-19 21:36:19 发布

阅读量3.5k

点赞数 3

分类专栏： java中文乱码文章标签： java jvm 开发语言

本文链接：https://blog.csdn.net/qq_51214556/article/details/126862332

版权

文章目录

1.字节流
2.碎碎念

1.字节流

讲述的代码将被分开一点点讲，毕竟看见一大堆代码肯定是有点烦的。

1.1.读取字节

新建一个txt文件，保存文本——“你好世界”
简单写一个字节流，用read()方法读取txt文件前三个字节。

File file=new File(……);
InputStream is=new BufferedInputStream(new FileInputStream(file));
//每次读取一个字节
int a=is.read();
int b=is.read();
int c=is.read();

我们先在这里查找"你"字对应的编码。


GB2312	C4E3
BIG5	A741
GBK	C4E3
GB18030	C4E3
Unicode	00004F60
UTF-8	E4BDA0
UTF-16BE	4F60
UTF-16LE	604F

再将上面代码读取到的字节输出，可以得到 a=0xE4，b=0xBD，c=0xA0。（十六进制）
可见读取到的字节是采用utf-8编码的。

System.out.println(a);
System.out.println(b);
System.out.println(c

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

玊非玉

关注关注

3
点赞
踩
9

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

专栏目录

java 文件读写中文_java读写中文文件

weixin_42502448的博客

02-16

1327

在用Java程序进行读写含中文的txt文件时，经常会出现读出或写入的内容会出现乱码。原因其实很简单，就是系统的编码和程序的编码采用了不同的编码格式。通常，假如自己不修改的话，windows自身采用的编码格式是gbk(而gbk和gb2312基本上是一样的编码方式),而IDE中Encode不修改的话，默认是utf-8的编码，这就是为什么会出现乱码的原因。当在OS下手工创建并写入的txt文件(gbk)，...

JAVA基础（字节流读写中文)

Cricket_7的博客

07-04

960

1，字节流读取中文【1】问题 字节流在读中文的时候有可能会读到半个中文,造成乱码【2】解决 字节流直接操作的字节,所以写出中文必须将字符串转换成字节数组写出回车换行 write("\r\n".getBytes()); 2，案例 public class Demo6_Chinese { /** * @param ar...

参与评论您还未登录，请先登录后发表或查看评论

字节流读写中文

LeoZuosj的博客

01-12

644

字节流读写中文 字节流读取中文的问题 字节流在读中文的时候有可能会读到半个中文,造成乱码 字节流写出中文的问题 字节流直接操作的字节,所以写出中文必须将字符串转换成字节数组写出回车换行 write("\r\n".getBytes()); package com.heima.stream; import java.io.FileInputStream; import java.i...

Java：读取中文，read方法

最新发布

2301_80772563的博客

03-19

104

【代码】Java：读取中文。

使用字节流读取中文的问题

Leon_Jinhai_Sun的博客

01-18

799

当使用字节流读取文本文件时，可能会有一个小问题。就是遇到中文字符时，可能不会显示完整的字符，那是因为一个中文字符可能占用多个字节存储。所以Java提供一些字符流类，以字符为单位读写数据，专门用于处理文本文件。 package com.learn.Demo04.Reader; import java.io.FileInputStream; import java.io.IOException;...

JAVA字节流读写中文

qq_40298054的博客

02-08

1406

一、问题 1.字节流读取中文的问题 字节流在读中文的时候有可能会读到半个中文,造成乱码 2.字节流写出中文的问题 字节流直接操作的字节，所以写出中文必须将字符串转换成字节数组，写出回车换行 write("\r\n".getBytes())；二、代码 public static void main(String[] args) throws IOException { Fil...

详解Java中字符流与字节流的区别

09-02

- 编码与解码：字符流在读写时会进行编码转换，而字节流不关心数据的字符编码。在实际开发中，选择字节流还是字符流取决于数据的类型。处理二进制数据，如图片、音频文件等，通常使用字节流；而处理文本文件，如...

java字节字符转换流操作详解

08-25

- **字节流到字符流的转换**：`InputStreamReader`类负责将字节流解析为字符流，根据指定的编码解码字节。 - **字符流到字节流的转换**：`OutputStreamWriter`类则用于将字符流转换为字节流，同样需要指定编码进行...

java之IO篇——File、字节流、字符流

2202_75483664的博客

08-04

1402

IO流是用于读写文件中的数据，要读写文件之前可以创建文件获取文件对象再创建IO流，正文会先介绍File类，通过File类的构造方法获取文件的对象，创建文件或目录以及File类的一些方法获取文件对象的属性。后面还介绍了相关的IO流体系，字节流和字符流的区别用法。目录前言一、File1.常用的成员方法(1) 判断、获取(2)创建、删除(3)获取并遍历2. 实操(1)遍历C盘下的以.avi结尾的文件(2)删除一个多级文件夹（里面的有些文件有内容）(3)统计各种文件的数量二、IO流分类三、IO体系1.字节流。

【Java 基础篇】Java字节字符流详解：轻松读写文本与二进制数据

繁依Fanyi的博客

09-18

1055

本篇博客详细介绍了Java中的字节流和字符流，以及它们的基本操作和示例。无论是处理文本数据还是二进制数据，Java提供了丰富的流类来满足各种需求。希望本文对初学者有所帮助，使他们更好地理解和运用Java中的流操作。如果你有任何问题或建议，请随时在下面的评论中提出。

Java中分别用字节流和字符流去读取文件中的中文

cxzos8i17的博客

07-15

1377

字符流FileReader是不能手动设置编码方式的，这里能输出是因为文档是以UTF-8的编码方式保存的，编译器也是默认UTF-8的编码方式，当文档为别的编码方式（如GBK) 保存时，编译时要更改编译器的编码方式，要使用另一种字符流InputStreamReader来代替，如下。最后如果想要输出文档中的汉字的话，我们把字节数组以UTF-8编码方式去解码，我们就可以通过这些数字的到相应的汉字，我们通过创建一个字符串对象接收字节数组和编码方式，再直接输出该变量名。再加一点：文件的编码保存形式在另存为中可以更改。

如何使用Java代码获取文件、文件流或字符串的编码方式.zip

02-11

本工程用于研究如何使用Java代码获取文件、文件流或字符串的编码方式本工程编码方式：UTF-8 开发工具：MyEclipse 参考博客：http://blog.csdn.net/gaohuanjie/article/details/43735891

[JAVA]介绍怎样在Java中通过字节字符流实现文件读取与写入

2301_79757798的博客

09-16

1816

File类是java.io包下代表与平台无关的文件和目录，程序中操作文件和目录，都可以通过File类来完成。通过这个File对象，可以进行一系列与文件相关的操作，比如判断文件是否存在，获取文件属性，读取文件内容，写入文件内容，新建，删除，重命名文件和目录。运行结果显示：运行结果显示：通过File对象对文件本身的操作，比如实现了对于文件的创建，文件的删除等等，但是对文件的内容，作为File对象它是无能为力不能进行操作的，我们只能通过字节字符流实现文件读取与写入1.字节输入流读取二进制文件。

java 获取文件编码

weixin_58494422的博客

06-06

1930

Java中有几种方法可以用来确定文件的编码

读取中文内容编码

fandongbao的专栏

03-06

153

public static String code(String name) throws IOException{ InputStream is = new FileInputStream(name); byte[] b = new byte[3]; is.read(b); String code = "GBK"; if (b[0] == -17 && b[1] == -69 && b...

java中读取文件时应该采用什么编码

congcongsuiyue的专栏

12-26

2377

Java读取文件的方式总体可以分为两类：按字节读取和按字符读取。按字节读取就是采用InputStream.read()方法来读取字节，然后保存到一个byte[]数组中，最后经常用new String(byte[]);把字节数组转换成String。在最后一步隐藏了一个编码的细节，new String(byte[]);会使用操作系统默认的字符集来解码字节数组，中文操作系统就是GBK。而我们从输

字节字符字符集编码解码进制

xiaoliuliu2050的专栏

11-18

1195

概念澄清字节是存储数据的基本单元(必须至少用1个字节的空间来表示一个内容)，所以它也是计算存储容量的一种计量单位。我们知道计算机只能识别1和0组成的二进制位。一个数就是1位（bit），为了方便计算，我们规定8位就是一个字节。例如：00001111这个8位二进制数就占了一个字节的存储容量。字符 1 任何一个文字或符号都是一个字符，但所占字节不一定 2 同一个字符不同...

字节编解码问题

HongKongEcho的专栏

12-17

534

decode与encode decode（）解码，encode（）编码最近用python对几千个txt文件进行分词处理，总是会报编解码的错误。通过查阅资料终于发现问题出在什么地方。读取txt中的内容时要根据txt的编码格式来决定是否需要解码。打开TXT文件点击另存查看编码格式，我用的文本都是ANSI格式，这种格式在读取时只需要直接读取即可不需要解码。进行分词后再读入新建的文档中，

java 中String编码和byte 解码总结

JoneWill

03-31

654

java 中String编码和byte 解码 http://wanxw2001.iteye.com/blog/1570339 1、InputStreamReader 是字节流通向字符流的桥梁：它使用指定的 charset 读取字节并将其解码为字符 InputStreamReader(InputStream in, String charsetName) 2、Outpu