c语言socket发送unicode,webSocket 二进制传输基础准备-Unicode转UTF16

前言

1.websocket 二进制数据传输基础准备工作2.webSocket 二进制传输基础准备-Unicode转UTF83.webSocket 二进制传输基础准备-Unicode转UTF16

昨天我们学习了Unicode转UTF8js中所有的string类型都是使用的UTF-16编码下面就直接开始吧

完整的 Unicode 字符集

UTF-16编码方式

Unicode码范围

UTF-16编码方式

字节

U+0000 ~ U+FFFF

等于原值

2

U+10000 ~ U+10FFFF

将Unicode值减去0x10000,得到20位长的值。
再将其分为高10位和低10位,分别为2个字节。
高10位和低10位的范围都在 0 ~ 0x3FF
高10位加0xD800,低十位加0xDC00

4

Unicode转UTF-16

今天使用 U+22222(大于U+10000) 进行转码UTF16

先进行减去0x10000

0x22222 – 0x10000 = 0x12222 = 1 0010 0010 0010 0010

转换二进制并且分割位高低10位

二进制1111111111 = 1023十进制

利用按位与的特性获取低10位

二进制1111111111 & 1 00100010 00100010 = 10 0010 0010

十进制1023 & 0x12222 = 546

低10位加0xDC00

546 + 0xDC00 = 56866 = 0xde22

利用带符号右移运算符以及按位与获取高10位

0x12222 << 10 = 72 = 1001000

1001000 & 1111111111 = 1001000

72 & 1023 = 72

高10位加0xD800

72 + 0xD800 = 55368 = 0xd848

U+22222编码转UTF-16 = [0xd848,0xde22]

var str = “”;

[0xd848,0xde22].forEach(item => {

str +=String.fromCharCode(item)

})

console.log(str);

明天就是假期了,尽可能的做出UTF-16与UTF-8 的互转。大概原理就是先将 字符 逆推转Unicode编码 然后再转你想要的编码格式

本文由乐趣区整理发布,转载请注明出处,谢谢。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值