- 博客(4)
- 资源 (4)
- 收藏
- 关注
转载 C++ UTF8编码转换 CChineseCode
一 预备知识 1,字符:字符是抽象的最小文本单位。它没有固定的形状(可能是一个字形),而且没有值。“A”是一个字符,“€”(德国、法国和许多其他欧洲国家通用货币的标志)也是一个字符。“中”“国”这是两个汉字字符。字符仅仅代表一个符号,没有任何实际值的意义。 2,字符集:字符集是字符的集合。例如,汉字字符是中国人最先发明的字符,在中文、日文、韩文和越南文的书写中使用。这也说明了字符和字符集之
2013-01-08 22:21:23 1049
转载 编码与工具
1、使用UltraEdit修改当前编辑的文本的编码 第一种方式:File -> Conversion 第二种方式:View -> Set Code Page 如果要在十六进制模式下编辑可以按Ctrl+H 2、对GBK编码的一个普遍误解 根据维基百科上的说明,GBK编码字符的方式包括一字节和双字节编码,00–7F范围内是一位,和ASCII保持一致,此范围
2013-01-08 22:02:02 992
转载 字符编码
1. 概述本文主要包括以下几个方面:编码基本知识,java,系统软件,url,工具软件等。在下面的描述中,将以"中文"两个字为例,经查表可以知道其GB2312编码是"d6d0 cec4",Unicode编码为"4e2d 6587",UTF编码就是"e4b8ad e69687"。注意,这两个字没有iso8859-1编码,但可以用iso8859-1编码来"表示"。2. 编码基本知识最早
2013-01-08 17:32:25 526
原创 再谈文本分析系统移植
这两天做了件前段时间想做而没有空做的事,将上半年搭建的文本分析扩展之后进行各种方式的打包发布。该系统是基于CRF++的,分别经过了分词阶段,词性标注阶段,实习识别阶段,而从实现方式上也经过了单线程,多线程,线程池,线程安全,本地执行,Thrift 服务,控制台接收,文本处理等阶段,其中所含内容甚多,虽在本地可以完美执行,但以静态库或动态库的方式移植至其他服务器却会出现问题,当然代码移植还是完美的。
2013-01-07 18:49:16 881 1
Linux进程控制
2013-04-22
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人