java中的字符编码和计算机存储单位

本文介绍了计算机中字符编码的基本原理,包括ASCII码、ISO-8859-1、GB2312、GBK和GB18030等编码方式。强调了编码和解码时必须使用相同字符编码的重要性,以及Unicode编码在支持全球文字上的作用。同时,提到了不同编码对于英文和中文的支持情况,以及在Java中采用的Unicode实现如UTF-8、UTF-16和UTF-32。
摘要由CSDN通过智能技术生成

计算机只能识别二进制.

1byte=8bit,1字节=8比特.

1bit就是一个1或0.

byte b=2,在计算机中是这样表示的:00000010.

short s=2,在计算机中是这样表示的:00000000 00000010.以此类推.

字符编码是人为的定义的一套转换表.

在字符编码中规定了一系列的文字对应的二进制.

字符编码其实本质上就是一本字典,该字典中描述了文字与二进制之间的对照关系.

字符编码是人为规定的.

字符编码涉及到编码和解码两个过程,编码和解码的时候必须采用同一套字符编码方式,不然就会出现乱码.

ASCII码采用1byte进行存储,因为英文字母是26个.(键盘上所有的键全部算上也不超过256个,1byte可以存储256种不同的情况,所有英文本身在计算机方面就占有优势)

'a'所对应的ASCII码位97.

'A'所对应的ASCII码位65.

'0'所对应的ASCII码位48.

'a'---(采用ASCII码进行编码)->01100001

01100001--(采用ASCII码进行解码)->'a'.

如果编码和解码采用的不是同一个编码方式,会出现乱码.

国际标准组织制定了ISO-8859-1编码方式,又称为latin-1编码方式,向上兼容ASCII码,但不支持中文.

简体中文这块的编码方式:GB2312<GBK<GB18030(容量的关系)

繁体中文:big5(台湾使用的是大五码).

在java中,java为了支持全球所有的文字,采用了一种编码方式叫做unicode编码,unicode编码统一了全球所有的文字,支持所有文字,具体的实现包括utf-8,utf-16,utf-32...

ASCII表:
 

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值