【Java基础】字符集

0. 预备知识

字符集(Character Set)是多个字符的集合,它规定了字符在计算机中的编码方式。

字符集的定义与作用

  1. 字符集是各种文字和符号的总称,包括各国家文字、标点符号、图形符号、数字等。
  2. 字符集使得计算机能够识别和存储各种文字,是实现文字信息化的基础。

在这里插入图片描述

1.计算机中的存储规则

在这里插入图片描述
GBK中一个汉字需要两个字节存储,一个英文占一个字节
ASCII字符集中一个英文占用1个字节
计算机中最小的存储单元是一个字节
GBK字符集完全兼容ASCII字符集

2. Unicode、UTF-8

在这里插入图片描述
在UTF-8的规则下英文1个字节,中文3个字节
UTF-8不是字符集,是Unicode字符集的一种编码方式

3. 为什么出现乱码

  1. 读取数据时未读完整个汉字在这里插入图片描述
  2. 编码和解码的方式不一致

4. 如何防止产生乱码

  1. 不要用字节流读取文本文件
  2. 编码与解码使用同一个编码方式,同一个码表
  • 5
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

boy快快长大

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值