Win32学习--(一)字符编码

1.传统的ASCII编码:8位 0~7F

  扩展的ASCII码表:16位 0~FF

 

2.Unicode编码:

1)什么是Unicode:这是一种编码方案,说白了是一张包含全世界所有文字的一个编码表,只要这个世界上存在的文字符号,统统给你一个唯一的编码

   Unicode编码范围是:0-0x10FFFF,可以容纳100多万个符号

2)Unicode的问题:Unicode知识一个符号及,它只规定了符号的二进制码,却没有规定这个二进制码应该如何存储

 

3、如何存储Unicode:UTF-16 / UTF-8 是Unicode的实现方式

1)UTF-16:UTF-16编码以16位无符号整数为单位,注意是16位为一个单位,不表示一个字符就只有16位。这个要看字符的Unicode编码处在什么范围而定,有可能是2个字节,也可能是4个字节。现在机器上的Unicode编码一般指的是UTF-16.

2)UTF-8:

    Unicode编码(16进制)                UTF-8字节流(二进制)

    000000-00007F                        0xxxxxxx

    000080-0007FF                        110xxxxx 10xxxxxx

    000800-00FFFF                        1110xxxx 10xxxxxx 10xxxxxx

    010000-10FFFF                        11110xxx 10xxxxxx 10xxxxxx 10xxxxxx

 

4、判断文本文件的存储格式:

BOM(Byte  Order  Mark)

UTF-8            EF BB BF

UTF-16LE         FF FE

UTF-16BE         FE FF 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值