- 博客(7)
- 收藏
- 关注
原创 【cl】统计n元串的频率:VC++ STL 的map, hash_map, set, vector...
<br /> 同样没有技术含量,从文件读入句子,利用空格切分成词语,将n元串插入multimap/multiset,统计频率,结果输出到文件。。<br /> <br /> 在之前的字符串处理和文件输入输出流的基础上,涉及到STL容器类的使用,如map/multimap, hash_map/hash_multimap, set/multiset, vector。<br /> <br /> 除了hash_map,其他几种都比较熟悉了。<br /> <br />hash_map不是C++标准,但VC++和很多第三
2009-11-15 01:16:00 545
原创 【cl】预处理&划分测试集、训练集
没有什么技术含量,完全在处理一些琐碎的边界条件。 很久没有写程序,花了一点时间温习VC++字符串处理和文件输入输出,总耗时三个小时囧 一些需要注意的小问题:词语之间有两个(全角?)空格;句子有时以空格+/n结尾,但每段最后一句没有空格;句子有时以/n/r结尾,但getline默认的终结符是/n,需要额外处理/r,否则划分之后会有小黑框出现在句子结尾。。。
2009-11-14 16:07:00 1103
原创 【wbia】lucene+IKAnalyzer
IKAnalyzer下载:http://code.google.com/p/ik-analyzer/ 配置:见使用手册,非常简单,在eclipse的工程中加入IKAnalyzer3.1.6GA.jar,并把IKAnalyzer.cfg.xml拷到工程的根目录即可。 然后就是使用手册上的test函数,赞。。。 一些可能有用的参考资料: http://www.try
2009-11-09 22:18:00 639
原创 【wbia】Lucene入门
1. 下载Lucene-2.9.0 2. 解压缩 3. 配置环境变量: 在CLASSPATH中加上c:/lucene-2.9.0/lucene-core-2.9.0,jar和c:/lucene-2.9.0/lucene-demos-2.9.0.jar 4. 运行demo: java org.apache.lucene.demo.IndexFiles c:/lucene-2.9.0/s
2009-11-05 23:24:00 376
原创 【db课程实习】Kdevelop下开发PostgreSQL
导入工程: Project->Import Existing Projects,选择源码目录,工程类型为generic-c-application(automake-based) 设置工程属性: Project->project options configure options->configure arguments --enable
2009-11-05 15:57:00 386
原创 【db课程实习】PostgreSQL基本命令
初始化数据库服务器: ./bin/initdb -D ./data 启动数据库服务器: ./bin/postmaster -D ./data & ( ./bin/pg_ctl start -D ./data ?) 关闭数据库服务器: ./bin/pg_ctl stop -D ./data 创建一个
2009-11-05 12:57:00 304
原创 【db课程实习】PostgreSQL安装
1.下载源代码:http://www.postgresql.org/download 2.解压缩:tar xzvf postgresql-8.4.1.tar.gz 3.配置: cd postgresql-8.4.1 CFLAGS="-O0 -g3" ./configure --enable-dubug --prefix=/home/oslab/p
2009-11-04 23:51:00 337
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人