前言
1.websocket 二进制数据传输基础准备工作2.webSocket 二进制传输基础准备-Unicode转UTF83.webSocket 二进制传输基础准备-Unicode转UTF16
昨天我们学习了Unicode转UTF8js中所有的string类型都是使用的UTF-16编码下面就直接开始吧
完整的 Unicode 字符集
UTF-16编码方式
Unicode码范围
UTF-16编码方式
字节
U+0000 ~ U+FFFF
等于原值
2
U+10000 ~ U+10FFFF
将Unicode值减去0x10000,得到20位长的值。
再将其分为高10位和低10位,分别为2个字节。
高10位和低10位的范围都在 0 ~ 0x3FF
高10位加0xD800,低十位加0xDC00
4
Unicode转UTF-16
今天使用 U+22222(大于U+10000) 进行转码UTF16
先进行减去0x10000
0x22222 – 0x10000 = 0x12222 = 1 0010 0010 0010 0010
转换二进制并且分割位高低10位
二进制1111111111 = 1023十进制
利用按位与的特性获取低10位
二进制1111111111 & 1 00100010 00100010 = 10 0010 0010
十进制1023 & 0x12222 = 546
低10位加0xDC00
546 + 0xDC00 = 56866 = 0xde22
利用带符号右移运算符以及按位与获取高10位
0x12222 << 10 = 72 = 1001000
1001000 & 1111111111 = 1001000
72 & 1023 = 72
高10位加0xD800
72 + 0xD800 = 55368 = 0xd848
U+22222编码转UTF-16 = [0xd848,0xde22]
var str = “”;
[0xd848,0xde22].forEach(item => {
str +=String.fromCharCode(item)
})
console.log(str);
明天就是假期了,尽可能的做出UTF-16与UTF-8 的互转。大概原理就是先将 字符 逆推转Unicode编码 然后再转你想要的编码格式
本文由乐趣区整理发布,转载请注明出处,谢谢。