全角半角与常见编码格式(ASCll、ANSI、GB2312、GBK、Unicode、UTF-8/UTF-16)总结

本文总结了计算机数据存储单位,介绍了全角半角的概念,并详细探讨了常见的编码格式,包括ASCII、ANSI、GB2312、GBK、Unicode及其变种UTF-8和UTF-16。解释了这些编码在存储和处理中文字时的作用和差异。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

在学习常见编码格式前先对一些基础知识进行总结:

1、计算机数据存储单位
  • 位(bit):最基本的概念。计算机中由于只有逻辑0和逻辑1的存在,因此很多东西、动作、数字都要表示为一串二进制的字码。其中每一个逻辑0或者1便是一个位。
  • 字节(byte):由8个位(bit)组成的一个单元,即8bit=1byte。具体应用如ASCII字符,便是运用字节来记录表示字母和一些符号。例如字符A便用 “0100 0001”来表示。
  • 字:16个位为一个字,它代表计算机处理指令或数据的二进制数位数,是计算机进行数据存储和数据处理的运算的单位。通常称16位是一个字,而32位则是一个双字,64位是两个双字。
2、全角半角
  • 通常的英文字母、数字键、符号键都是半角的。在系统内部,以上三种字符是作为基本代码处理的,所以用户输入命令和参数时一般都使用半角。
  • 汉语、日语、及朝鲜文等文字语言的字库量远大于256个,所以改用两个字节来储存。同时,也是因为中日韩等文字的书写习惯,如果统一使用全角字符的话,排列起来也显得整齐。
  • 全角占2字节,半角占1字节。而不管是半角还是全角,汉字都还是要占两个字节。
  • Ascll中127以下的叫半角,127以上的是全角(并且每两位用来表示一个汉字)
3、常见编码格式
  1. ASCll码(American Standard Code for Information Interchange):美国信息交换标准码
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值