在学习常见编码格式前先对一些基础知识进行总结:
1、计算机数据存储单位
- 位(bit):最基本的概念。计算机中由于只有逻辑0和逻辑1的存在,因此很多东西、动作、数字都要表示为一串二进制的字码。其中每一个逻辑0或者1便是一个位。
- 字节(byte):由8个位(bit)组成的一个单元,即8bit=1byte。具体应用如ASCII字符,便是运用字节来记录表示字母和一些符号。例如字符A便用 “0100 0001”来表示。
- 字:16个位为一个字,它代表计算机处理指令或数据的二进制数位数,是计算机进行数据存储和数据处理的运算的单位。通常称16位是一个字,而32位则是一个双字,64位是两个双字。
2、全角半角
- 通常的英文字母、数字键、符号键都是半角的。在系统内部,以上三种字符是作为基本代码处理的,所以用户输入命令和参数时一般都使用半角。
- 汉语、日语、及朝鲜文等文字语言的字库量远大于256个,所以改用两个字节来储存。同时,也是因为中日韩等文字的书写习惯,如果统一使用全角字符的话,排列起来也显得整齐。
- 全角占2字节,半角占1字节。而不管是半角还是全角,汉字都还是要占两个字节。
- Ascll中127以下的叫半角,127以上的是全角(并且每两位用来表示一个汉字)
3、常见编码格式
- ASCll码(American Standard Code for Information Interchange):美国信息交换标准码