字符编码&字符集

ASCII

ASCII 最初由美国标准协会制定,是基于拉丁字母的一套电脑编码系统,主要用于显示现代英语和其他西欧语言。

ASCII字符集:包括控制字符(换行符、制表符等) 和 可打印字符(包括空格、数字0-9、小写字母a-z、大写字母A-Z以及一些标点符号、运算符等)。

ASCII码使用7位(bit)【8位一个字节】表示一个字符(所以一个ASCII字符占一个字节),ASCII码总共可以表示128个不同的字符。例如,A的ASCII码是65,数字0的ASCII码是48。

ASCII码是许多其他复杂字符编码的基础,如UTF-8、UTF-16、GBK等。

unicode

unicode是一种计算机编码字符集。
在早期的计算机系统中,存在大量的字符编码标准,如ASCII、GBK、Big5等,这些标准通常只支持一种语言或一组语言。这导致当处理多语种文本时,不得不在不同的编码之间转换,这是一件非常复杂且容易出错的事情。为了解决这个问题,Unicode提供了一个唯一的数字来表示任何一个字符,无论这个字符在什么平台、程序、语言中。

unicode字符集完全兼容了ASCII字符集,在0-127的范围内,Unicode字符集和ASCII字符集的字符编码是完全一样的。这也意味着,任何一个ASCII编码的文本,都可以被看作是一个有效的Unicode编码的文本

注:unicode只定义了字符的唯一数字标识,而没有定义数字在计算机中如何存储。UTF-8、UTF-16、UTF-32等就是定义了如何在计算机中存储Unicode字符的编码方式。

编码方式

含义:一种将字符转换为计算机可以理解的数字的规则或方法。
1、UTF-8:一种针对Unicode的字符编码,使用一至四个字节为每个字符编码,包括英文字符、数字、中文、日文等全世界所有的字符。其中,ASCII范围内的字符被编码为单个字节(占一个字节),中文占三个字节。

2、GBK:是一个扩展的GB2312编码方式,支持中文,收录了所有的GB 2312-1980汉字字符集。该编码方式下,一个中文字符占两个字节。不是国际标准,是中国的国家标准。

3、ISO_8859_1:是国际化标准组织(ISO)发布的一套八位的字符集,它包含了128个ASCII字符和128个欧洲字符,用于显示西欧系统的语言。这种编码方式不支持中文

  • 5
    点赞
  • 7
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值