Emoji在日常生活中慢慢流行起来,在Unicode中的数量也越来越多。目前Unicode11.0中定义的Emoji可以在这里找到。
多Unicode类型的Emoji引入,使得UTF-32定长的随机访问的优势丧失。
Emoji主要包含一下五种规则。
-
单Unicode
- 由单个Unicode码位组成。
-
- 由两个Unicode码位组成。
-
-
在IOS下,部分Emoji会带有
VS16
U+EF0F
-
-
使用
零宽度连接符
ZWJ
U+200D
连接多个码位。但是实际上是作为一个Emoji显示。 - 最少的为3个Unicode。最长的甚至到7个Unicode
- 在不支持的系统,则按照多个Emoji显示。
-
-