从一个字符串中获取中文

最新推荐文章于 2022-08-02 00:54:38 发布

cectorhuang

最新推荐文章于 2022-08-02 00:54:38 发布

阅读量862

点赞数

分类专栏： c/c++

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/feixiangdeyuzijiang/article/details/18099183

版权

c/c++ 专栏收录该内容

7 篇文章 0 订阅

订阅专栏

中文的编码方式与英文不同，编码方式有UTF-8，GBK，gb2312,unicode等，UTF-8是国际编码，包括中文，若需要在国外不下载语言插件显示，就用它，但是有一个弊端，它的编码中，英文还是一个字节，但是中文却是三个字节，而GBK和gb2312是中国的编码，中文占两个字节，而unicode是中英文全部占两个字节。在计算机世界中，美国定义了0-255这256个数表示不同的状态，0-127中有英文大小写字母和数字等，128-255这128个状态代表了下划线、方框线等扩展字符，这就是美国标准信息交换码（ASCII），后来中文加进去，是加在128-255这128个状态的，每两个字节代表一个中文，这可以表示六千多汉字，但还不够，后来规定，两个字节中，若第一个字节的ASCII码码值大于等于128，这个字符就和后面的字符以期组成一个汉字，因此，从字符串中读取汉字就用这个方法，判断一个字节的ASCII码，若大于等于128，那就自加两次，这个东西就是一个汉字，若不是就自加一次读取这个位置上的字符。

代码如下：

CStringCFTP::GetChinese(const CString& st)

{

CString str=_T("");

for(int i=3;i<st.GetLength();i++)//我用到的是从3这个位置开始的，是获取的一串中文，并不是分散的

{

if((UCHAR)st.GetAt(i)>=128)

str+=st.Mid(i++,2);

else

break;

}

return str;

}

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
从一个字符串中获取中文

中文的编码方式与英文不同，编码方式有UTF-8，GBK，gb2312,unicode等，UTF-8是国际编码，包括中文，若需要在国外不下载语言插件显示，就用它，但是有一个弊端，它的编码中，英文还是一个字节，但是中文却是三个字节，而GBK和gb2312是中国的编码，中文占两个字节，而unicode是中英文全部占两个字节。在计算机世界中，美国定义了0-255这256个数表示不同的状态，0-127中有英
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。