重用代码之LinuxC&C++_李亚超的博客-CSDN博客

重用代码之LinuxC&C++

关注

文章平均质量分 78

关注数：文章数：5 文章阅读量：25514 文章收藏量：16

作者: 李亚超

自强不息，厚德载物；专注于Deep Learning, Machine Translation, NLP；喜欢写关于Linux C/C ，C#，算法，自然语言处理的技术博客，欢迎观临；

展开

Unicode(UTF16)文件读写终极方案---用C++标准的字节流读取，转化为宽字符(wchar_t)，再以字节流写入

用C++做程序真够麻烦的，先不说各种数据类型搞的人头疼，再者读写各种编码的文本文件ansi、Unicode、UTF-8等等，让人头晕目眩的。这半年来经常要用C++处理各种不同编码的文本文件，开始读取Unicode文件，一直很麻烦。用了wifstream，wsp

原创 2011-07-29 13:13:17 · 11323 阅读 · 4 评论
一个通用的Trie树，标准C++实现

1 Trie简介 Trie树，又称单词查找树或键树，是一种树形结构，是一种哈希树的变种。典型应用是用于统计和排序大量的字符串（但不仅限于字符串），所以经常被搜索引擎系统用于文本词频统计。它的优点是：最大限度地减少无谓的字符串比较，查询效率比哈希表高。在本文中，对于输入的进行序列化，比如输入“单词查找树”，序列化为“单/词/查/找/树”，这样可以进行任何一种自

原创 2012-04-03 13:09:12 · 6191 阅读 · 1 评论
ScorePP-用标准C++实现的自动分词评测程序

中文分词是自然语言处理的基础性关键问题，近一年来一直在进行着分词方面的研究。一开始用的是Sighan backoff 提供的用Perl脚本编写的分词打分程序Score。为了把用C++写的分词程序和评测程序无缝的结合在一起，同时也为了自动的分析分词中的错误原因，参考Score改写了在C++下的评测程序，我自己称它为ScorePP。为了分词很长时间都没有休息了。中午走出自动化所的食

原创 2012-04-13 17:05:58 · 3498 阅读 · 2 评论
【算法导论】用C++实现快速排序

本算法为【算法导论】7.1的C++实现，代码如下：#includevoid swap(int * a,int * b);int partition(int * array_list,int left,int right);void quick_sort(int * array_list,int left,int right);void Print();const int size

原创 2012-06-29 16:14:57 · 1670 阅读 · 1 评论
Unicode(UTF16)文件读写终极方案

去年写过一个博客介绍了自己写的一个读写Unicode编码文件的方法，这个方法不使用系统提供的类库，使用标准C++的方法，因此很很好的可移植性。上次写的没经过大规模的测试，这几天对这个方法进行了修改：1支持Windows和Linux的换行符2修改了部分代码，使之更加健壮代码如下：/* ******************************************

原创 2013-02-26 21:31:56 · 2832 阅读 · 0 评论

重用代码之LinuxC&C++

作者: 李亚超

Unicode(UTF16)文件读写终极方案---用C++标准的字节流读取，转化为宽字符(wchar_t)，再以字节流写入

一个通用的Trie树，标准C++实现

ScorePP-用标准C++实现的自动分词评测程序

【算法导论】用C++实现快速排序

Unicode(UTF16)文件读写终极方案