还记得我C#使用StringInfo正确查找字符个数_C#,unicode_黄腾霄的博客-CSDN博客这篇博客么?
你们以为2个Unicode组成的emoji就是极限了么?
这篇文章会带你们体验下世界语言的博大之组合字。
组合字就是说对于某些精妙的语言,多个单独可渲染的文字,放在一起后就会渲染成一个文字。
其中最著名的就是我们的藏文。下图是wiki上的说明,大致意思就是一个藏文基字可以通过加加加好多个字,变成还是一个字。
(图片来自wiki)
比如我们可以看到下面两个藏文Unicode的渲染是这样的
但是他们合并起来之后就变成这样了
同样对于སྒྲོ
字符,你看着是一个字符,实际上它有4个Unicode编码。