c语言字节转字符串gbk,不依赖任何系统API,用c语言实现gbk/utf8/unicode编码转换

汉字'我'

Unicode编码是 0x6211 0110

0010

00

010001

UTF8编码是 0xe68891 1110

0110

10

001000

100

010001

oxc0 11000000

0xE0 11100000

| Unicode符号范围 | UTF-8编码方式

n | (十六进制) | (二进制)

---+----------------------- -----------+--------------------------------------------------------------------------

1 | 0x00 - 0x7F | 0zzzzzzz

2 | 0x80 - 0x7FF | 110yyyyy 10zzzzzz

3 | 0x800 - 0xFFFF | 1110xxxx 10yyyyyy 10zzzzzz

--------------------------------------------------------------------------------------------------------------------

4 | 0x10000 - 0x1FFFFF | 11110xxx 10xxxxxx 10xxxxxx 10xxxxxx

5 | 0x200000 - 0x3FFFFFF | 111110xx 10xxxxxx 10xxxxxx 10xxxxxx 10xxxxxx

6 | 0x4000000 - 0x7FFFFFFF | 1111110x 10xxxxxx 10xxxxxx 10xxxxxx 10xxxxxx 10xxxxxx

表 UTF-8的编码规则

一:unicode转utf8

'我'的unicode编码0x6211,二进制为:01100010 00010001

将二进制形式分割成3段为0110 001000

010001

(分别是高4位、中间的6位、最后的低6位)

unicode转utf8只需要这3段分别填入1110xxxx 10yyyyyy 10zzzzzz中的xxxx yyyyyy zzzzzz

得utf8编码是0xe6889,二进制为: 11100110 10001000 100010001

int UnicodeToUtf8(char* pInput,char *pOutput)

{

int

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值