【Java IO流】字符集使用详解

本文详细介绍了字符集的概念,包括ASCII、GBK、Unicode等,以及它们在计算机中的存储规则。通过分析,揭示了为什么使用字节流读取文本时会出现乱码。Java中乱码问题通常源于读取数据不完整或编码解码方式不一致。文章提供了编码解码的Java示例,帮助理解相关原理。
摘要由CSDN通过智能技术生成

前言

上一节关于字节流的文章中,在使用字节流读取本地文件中的数据时,文件中只存放了英文,而并没有存放中文数据。我们还提到了不建议使用字节流读取纯文本文件的数据,否则会出现乱码的情况,那么,为什么会出现这样的情况呢?相信探讨完今天的内容,你会有新的理解。

在计算机中,任何数据都是以二进制的形式存储的,一位二进制数称为一个比特位,一个字节由 8 位二进制数组成,存放 2 的 8 次方个数据,字节是计算机中最小的存储单元

而英文存放数据只需要一个字节即可,为什么呢?这就需要我们学习字符集的知识,字符集也叫作编码表,例如 ASCII 字符集,把一些常用的字符编写为一个表,每个字符对应了一个整数值,ASCII 表中一共 128 个数据,其中英文就全部包括在其中,所以说,存放英文数据至于要一个字节即可。

目前的文字编码标准主要有 ASCII、GB2312、GBK、Unicode 等。ASCII 编码是最简单的西文编码方案。GB2312、GBK、GB18030 是汉字字符编码方案的国家标准。Unicode

评论 10
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

橙 子_

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值