在C#中处理字符簇

最新推荐文章于 2025-02-24 15:12:35 发布

crystal_lz

最新推荐文章于 2025-02-24 15:12:35 发布

阅读量815

点赞数 2

分类专栏：开源字符处理文章标签： c# 开发语言后端

本文链接：https://blog.csdn.net/crystal_lz/article/details/121220054

版权

前言

在这之前首先感谢我的朋友：netero，是他给了我很多帮助完成了这份代码。

因为我们在一起处理一些文本的时候发现，对于一些特殊的字符我们无法准确的得到我们想要的长度。于是查阅了很多资料和相关的代码，本以为已经解决了这个问题，可是发现GitHub上的一些代码并不能正确的得到结果。因为他们的代码大多数是按照Unicode 10.0.0的文档编写的，然而现在已经是 Unicode 14.0.0的版本了，于是自己动手。。

项目地址：https://github.com/DebugST/STGraphemeSplitter

案例

在我们编写代码的时候会经常对字符串进行处理。比如：获取字符串长度，获取某个索引所在的字符。

string strText = "abc";
Console.WriteLine(strText.Length) // output is: 3

//但是...当有一些特殊字符的时候...比如emoji表情的时候。。

string strText = "👩‍🦰👩‍👩‍👦‍👦🏳️‍🌈";
Console.WriteLine(strText.Length) // output is: 22