文字编码
文章平均质量分 81
wrq19852004
这个作者很懒,什么都没留下…
展开
-
C++的三种字符编码方式
C++的三种字符编码方式 c++通常使用的是三种编码方式,分别是SBCS(single byte character set),MBCS(multi-byte characterset)和Unicode字符集。SBCS是一个字节一个字符,MBCS是几个字节一个字符,可能是一个,两个,三个不等,但是实际上,绝大多数时候使用两个字节的,所以有时候看到DBCS(double-byte ch转载 2009-09-17 11:15:00 · 181 阅读 · 0 评论 -
C++的三种字符编码方式
C++的三种字符编码方式 c++通常使用的是三种编码方式,分别是SBCS(single byte character set),MBCS(multi-byte characterset)和Unicode字符集。SBCS是一个字节一个字符,MBCS是几个字节一个字符,可能是一个,两个,三个不等,但是实际上,绝大多数时候使用两个字节的,所以有时候看到DBCS(double-byte ch转载 2009-09-17 11:15:00 · 475 阅读 · 0 评论 -
unicode utf-8 gb18030 gb2312 gbk各种编码对比
unicode utf-8 gb18030 gb2312 gbk各种编码对比 在修改一个cms的过程当中遇到一个php截取字符串的函数(当然得兼容中英字符了),因为对各种编码的字符范围和字符表示不清楚,感觉一头迷雾,虽然可以直接来调用这个函数但是我这个的特点是追究原理,我在乎的事情都想弄明白,于是各个qq群依次发信息,没人理会。唉,郁闷。只好自己google it and teach my转载 2009-09-17 11:18:00 · 405 阅读 · 0 评论 -
GB18030编码研究以及GBK、GB18030与Unicode的映射
GB18030编码研究以及GBK、GB18030与Unicode的映射 GB18030有两个版本:GB18030-2000和GB18030-2005。在本文中,没有指明版本的GB18030是指GB18030-2005。本文讨论了以下问题:1. GB2312有682个图形符号,都放在1区。GBK的1区有717个图形符号,5区有 166个图形符号,一共有883个图形符号转载 2009-09-17 11:13:00 · 185 阅读 · 0 评论 -
字符编码方式基本知识
字符编码方式基本知识 ASCII:基本字符集是128个常用字符,扩展字符集是128个,共256个,用1个字节表示。GB2312:6千多个常用汉字GBK:1万多个汉字GB18030:更多,不过依然是两个字节来表示汉字。上面三种GB*可以统一称为ANSI编码,且16个bit的第一个必定是1。BIG5:繁体字符集,用于台湾地区Unicode:两字节表示的世界通用码,存储为文本时会有连个字节的转载 2009-09-17 11:16:00 · 294 阅读 · 0 评论 -
维基百科----UTF-16
维基百科----UTF-16 维基百科,自由的百科全书跳转到: 导航, 搜寻UTF-16是Unicode的其中一个使用方式。 UTF是 Unicode/UCS Transformation Format,即把Unicode转做某种格式的意思。它定义于ISO/IEC 10646-1的附录Q,而RFC2781也定义了相似的做法。在Unicode基本多文种平面定义的字符(无论是拉转载 2009-09-17 11:18:00 · 256 阅读 · 0 评论 -
VC/C++的中文字符处理方式
VC/C++的中文字符处理方式 怎样把汉字转换成整数,又怎样把该整数还原成汉字char * str="汉字";BYTE *pstr=(BYTE*)str;BYTE B=pstr[i];B 就是整数一 引入问题代码 wchar_t a[3]=L”中国”,编译时出错,出错信息为:数组越界。但wchar_t 是一个宽字节类型,数组a的大小应为6个字节,而两个汉字的的unicode码占转载 2009-09-17 11:17:00 · 181 阅读 · 0 评论