unicode
xinyue_htx
自建博客https://xinyuehtx.github.io/
展开
-
Unicode代理对(utf-16)
我们都知道Unicode的大部分字符都是都是使用16位编码,即2个字节表示。这也是为什么正则匹配中,Unicode使用“\uxxxx”进行匹配的原因为什么说是大部分呢?因为还有一个神奇的区域,叫做Unicode代理对。它们需要使用4个字节来表示一个字符。这里就给大家做介绍。问题来源Unicode的产生是为了处理不同语言之间的编码不兼容问题。比如如果中文和日文的不同文字使用了同一个编码...原创 2020-02-29 14:21:01 · 2329 阅读 · 0 评论 -
合字研究——看看藏文里面一共有多少个字吧
还记得我C#使用StringInfo正确查找字符个数_C#,unicode_黄腾霄的博客-CSDN博客这篇博客么?你们以为2个Unicode组成的emoji就是极限了么?这篇文章会带你们体验下世界语言的博大之组合字。组合字就是说对于某些精妙的语言,多个单独可渲染的文字,放在一起后就会渲染成一个文字。其中最著名的就是我们的藏文。下图是wiki上的说明,大致意思就是一个藏文基字可以通过加加加...原创 2020-02-22 10:19:24 · 1978 阅读 · 1 评论 -
C#使用StringInfo正确查找字符个数
之前在处理文本的时候遇到过这样的一个问题,有的字,它看着是一个,但是程序说他是两个,但是实际真的是一个。好吧,你们一定没有听懂我在讲什么。没关系一起来看看代码假如有这么一个字符串“黄腾霄好瘦哦”,需要使用程序找出这个字符串包含几个字,怎么找?var s=“黄腾霄好瘦哦”;var len=s.Length;很简单是不是。那再看看这个字符串,“黄腾霄也能算瘦????”,不出意料的话应该是8个字...原创 2020-02-22 10:12:40 · 2601 阅读 · 0 评论