- 博客(3)
- 收藏
- 关注
原创 libsvm java版本使用心得
项目中要用到svm分类器,自己实现的话太费时间,于是寻找开源实现,找到了libsvm。 java版本是一个jar包,引入到工程中即可使用。 需要注意的是,java版本充满了c++风格(类名小写,命名使用下划线_分隔等等),使用者需要稍微适应一下。 核心类是svm类,最常用的几个方法如下(都是static方法): svm.svm_load_model(String),望文生义即可知是加载已训
2014-02-13 14:27:36 3216 3
原创 hadoop StringUtils split方法的坑
今天写hadoop job时发现了一个坑。 使用StringUtils类的split方法对字符串做分割,不小心引入了hadoop自身的StringUtils类,job出错,仔细debug检查后才找到问题所在。 jdk版StringUtils类只把空白符作为分割符。 hadoop版StringUtils类把标点符号也作为分隔符。 在写job的时候小心不要引入错了。
2013-05-10 14:43:10 1107
原创 hadoop多目录输出1
第一次写博文,希望以后能一直坚持下去。 本文主要分享hadoop中如何实现多文件输出。 实际hadoop job开发中,我们的输出数据可能不止一类,并且需要将不同的数据类以不同的文件名输出保存。例如典型的wordcount实现,如果既要统计单词在所有文档中的出现次数,又要统计单词在所有文档中的出现行数,将这两个次数输出到count.txt文件和line.txt文件中。类似这样的
2013-04-27 16:18:23 683
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人