重用代码之LinuxC&C++
文章平均质量分 78
李亚超
自强不息,厚德载物;
专注于Deep Learning, Machine Translation, NLP;
喜欢写关于Linux C/C ,C#,算法,自然语言处理的技术博客,欢迎观临;
展开
-
Unicode(UTF16)文件读写终极方案---用C++标准的字节流读取,转化为宽字符(wchar_t),再以字节流写入
用C++做程序真够麻烦的,先不说各种数据类型搞的人头疼,再者读写各种编码的文本文件ansi、Unicode、UTF-8等等,让人头晕目眩的。 这半年来经常要用C++处理各种不同编码的文本文件,开始读取Unicode文件,一直很麻烦。用了wifstream,wsp原创 2011-07-29 13:13:17 · 11323 阅读 · 4 评论 -
一个通用的Trie树,标准C++实现
1 Trie简介 Trie树,又称单词查找树或键树,是一种树形结构,是一种哈希树的变种。典型应用是用于统计和排序大量的字符串(但不仅限于字符串),所以经常被搜索引擎系统用于文本词频统计。它的优点是:最大限度地减少无谓的字符串比较,查询效率比哈希表高。 在本文中,对于输入的进行序列化,比如输入“单词查找树”,序列化为“单/词/查/找/树”,这样可以进行任何一种自原创 2012-04-03 13:09:12 · 6191 阅读 · 1 评论 -
ScorePP-用标准C++实现的自动分词评测程序
中文分词是自然语言处理的基础性关键问题,近一年来一直在进行着分词方面的研究。一开始用的是Sighan backoff 提供的用Perl脚本编写的分词打分程序Score。为了把用C++写的分词程序和评测程序无缝的结合在一起,同时也为了自动的分析分词中的错误原因,参考Score改写了在C++下的评测程序,我自己称它为ScorePP。 为了分词很长时间都没有休息了。中午走出自动化所的食原创 2012-04-13 17:05:58 · 3498 阅读 · 2 评论 -
【算法导论】用C++实现快速排序
本算法为【算法导论】7.1的C++实现,代码如下:#includevoid swap(int * a,int * b);int partition(int * array_list,int left,int right);void quick_sort(int * array_list,int left,int right);void Print();const int size原创 2012-06-29 16:14:57 · 1670 阅读 · 1 评论 -
Unicode(UTF16)文件读写终极方案
去年写过一个博客介绍了自己写的一个读写Unicode编码文件的方法,这个方法不使用系统提供的类库,使用标准C++的方法,因此很很好的可移植性。上次写的没经过大规模的测试,这几天对这个方法进行了修改:1支持Windows和Linux的换行符2修改了部分代码,使之更加健壮代码如下:/* ******************************************原创 2013-02-26 21:31:56 · 2832 阅读 · 0 评论