- 博客(4)
- 资源 (1)
- 收藏
- 关注
原创 找工作小程序
通过键盘输入一串小写字母(a~z)组成的字符串。请编写一个字符串过滤程序,若字符串中出现多个相同的字符,将非首次出现的字符过滤掉。 比如字符串“abacacde”过滤结果为“abcde”。 要求实现函数:void stringFilter(const char *pInputStr, long lInputLen, char *pOutputStr); 【输入】 pInputStr: 输入
2013-09-20 10:24:11 501
原创 提取词库程序
提取词库的程序中间停了好长时间,前几天改了一下,暂时算是写完了。实现了基本功能,去掉数字,去掉停用词,去掉标点符号。 印象比较深刻的几点是,程序的逻辑从模糊到清楚,从混乱复杂到比较简单。去掉了冗余的比较和无意义的区分。总体的逻辑没有变。按空格读取文本信息存入vector容器中。对每一个字符串,先检查是否含有字母,不含则直接移到下一个字符串。然后分为字符串头去符号检查,字符串中去符号检查,字符串尾
2013-08-14 13:28:17 842
原创 libsvm分类示例程序实现
操作平台:windows7 1 从网站 http://www.csie.ntu.edu.tw/~cjlin/libsvm/ 上下载libsvm压缩文件,解压 2 下载python, gnuplot 安装 3 配置python环境变量可以参考这篇文章: http://blog.sina.com.cn/s/blog_6344eb200100fwxl.html 因为我曾经出现过这种错误:
2013-04-23 12:31:07 972
原创 基因项目小记
之前的账号总是开不了博客 今天好不容易开了 一定要坚持! 正儿八经做的第一个项目 基因测序 step1: 1 将基因注释文件(.gff3 70MB)导入到MySQL数据库。 load data local infile '文件路径' into table 表名 2 根据注释文件中的信息从测序数据(.fa 940MB)中获取数据。 1 C++对文件进行操作的时候,
2013-04-18 13:55:13 482
文本分类文档预处理(英文)
2013-08-14
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人