自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

  • 博客(20)
  • 资源 (12)
  • 收藏
  • 关注

转载 rweter

package com.unicom.classifiers;import java.util.List;import org.apache.commons.cli2.CommandLine;import org.apache.commons.cli2.Group;import org.apache.commons.cli2.Option;import org.

2013-12-31 18:08:21 274

转载 mahout调用流程分析

from http://hi.baidu.com/izouying/item/cea7e76658e85937ac3e83f6剖析mahout脚本mahout 位于$MAHOUT_HOME/bin目录下,是所有mahout调用的入口。主要会做各类环境变量的设置。MAHOUT_JAVA_HOME:指定java的执行路劲,会覆盖$JAVA_HOMEMAHOUT_HEAP

2013-12-31 13:44:36 342

原创 Ant-Ivy使用

Apache Ivy是专门用来管理项目的jar包依赖的。我们知道Maven已经有很出色的这方面的功能,如果你已经在使用Maven,就没必要使用Ivy了。但是其实Maven除了这方面功能,还有很多强大的功能,如果你只需要管理jar包依赖而已,那么可以只用Ivy就够了,用Maven就有点大材小用。 1.      首先,你的机器应该已经安装了Ant和JDK,最好是1.6或更高版本的Ant,并在

2013-12-30 17:22:35 335

原创 mahout 命令与类相应的映射文件

在mahout中是通过MahoutDriver来运行我们自己编写的和它自带的程序的main函数,以下是driver.classes.props文件#Utilsorg.apache.mahout.utils.vectors.VectorDumper = vectordump : Dump vectors from a sequence file to textorg.apache.mahout.ut

2013-12-30 13:45:26 895

原创 js string object

String ObjectThe String object is used to manipulate a stored piece of text.String objects are created with new String().Syntaxvar txt = new String("string");or more simply:var txt

2013-12-30 11:12:09 612

原创 lucene,mahout中文分词杂记

http://git.oschina.net/lionsoul/jcseg

2013-12-28 21:40:10 721

转载 lucene 中文分词

内容提要:以ChineseAnalyzer为例,简单讲讲lucene分析器,也就是analyzer的分析过程一:分析器原理语料——>过滤器过滤——>tokeniner分词器分词——>词元——>放进字典(记录词元和位置信息)二:代码分析1:一共有5个类,第一个是ChineseAnalyzer分析器类,还有ChineseFilter过滤器类和它的工厂类,和Chinese

2013-12-28 17:27:33 360

原创 maven 杂记

解决 'build.plugins.plugin.version' for org.apache.maven.plugins:maven-compiler-plugin is missing. @ line ?, column ?http://qiang106.iteye.com/blog/1388645

2013-12-28 16:05:24 717

转载 稀疏矩阵的存储格式(Sparse Matrix Storage Formats)

from http://blog.csdn.net/anshan1984/article/details/8580952                                                            稀疏矩阵的存储格式对于很多元素为零的稀疏矩阵,仅存储非零元素可使矩阵操作效率更高。现有许多种稀疏矩阵的存储方式,但是多数采用相同的基本技

2013-12-26 13:39:18 1661

原创 TDIDF 自动提取关键词

TDIF学习资料http://www.ruanyifeng.com/blog/2013/03/tf-idf.html

2013-12-24 15:40:08 581 1

原创 markov model学习

收集一些中文学习马尔克夫模型的资料,http://www.52nlp.cn/category/hidden-markov-model

2013-12-23 23:35:09 321

原创 mahout classify 输入编程

package com.unicom.classifiers;import java.io.BufferedReader;import java.io.FileReader;import org.apache.hadoop.conf.Configuration;import org.apache.hadoop.fs.FileSystem;import org.a

2013-12-23 00:18:58 320

转载 mahout 自动化分类twitter信息

from http://chimpler.wordpress.com/2013/03/13/using-the-mahout-naive-bayes-classifier-to-automatically-classify-twitter-messages/Classification algorithms can be used to automatically classify doc

2013-12-21 17:36:51 818

转载 awk 正则表达式

前言:使用awk作为文本处理工具,正则表达式是少不了的。 要掌握这个工具的正则表达式使用。其实,我们不必单独去学习它的正则表达式。正则表达式就像一门程序语言,有自己语法规则已经表示意思。 对于不同工具,其实大部分表示意思相同的。在linux众多文本处理工具(awk,sed,grep,perl)里面用到正则表达式。其实就只有3种类型。详细可以参考:linux shell 正则表达式(BREs,E

2013-12-21 16:12:23 316

原创 linux shell 学习

shell 学习网站http://linux.vbird.org/linux_basic/0340bashshell-scripts.php

2013-12-15 16:42:11 330

原创 vim 替换

转载:http://andyss.blog.51cto.com/315552/131652语法为 :[addr]s/源字符串/目的字符串/[option]全局替换命令为::%s/源字符串/目的字符串/g[addr] 表示检索范围,省略时表示当前行。如:“1,20” :表示从第1行到20行;“%” :表示整个文件,同“1,$”;“. ,$” :从当前行到文件尾;

2013-12-15 13:44:02 282

原创 hadoop 测试 api

我做基准测试主要是用了hadoop-0.20.2-test.jar这个工具jar包。主要是做了I/O的测试。在网上也找了一些资料,抄抄谢谢记录如下:DFSCIOTest    测试libhdfs中的分布式I/O的基准。Libhdfs是一个为C/C++应用程序提供HDFS文件服务的共享库。DistributedFSCheck    文件系统一致性的分布式检查。Test

2013-12-14 22:40:31 287

原创 mahout 源码分析 classifier

版本:mahout 0.6 模块:classification算法:bayes训练model过程1.    org.apache.mahout.classifier.bayes.TrainClassifier public static void trainNaiveBayes(String dir, String outputDir, int gramSize) thro

2013-12-14 15:25:12 96

原创 学习mahout最好的中文资料

最近在学习mahout,搜索关于mahout的资料,终于看到好的,mahout对于cf,cluster,classification的有比较好的讲解http://www.slideshare.net/bigdatasyd/machine-learning-withmahout

2013-12-11 21:17:24 324

原创 mahout classification

最近在看mahout in action,大部分看完了,但是zu

2013-12-11 18:36:57 338

C#学习资料

涵盖c#所有基础知识,以及重点和难点等等!

2012-05-20

历年考试DB2考试内容,必有。

历年考试DB2考试内容,必有

2012-03-24

软考试题解析资料

软考试题解析资料,程序员,软件设计师,系统设计师,网络管理员等等关于软考的!

2011-10-16

数据结构

学习数据结构的好资料,这也是学习数据结构的资料的!包括哈夫曼树,关键路径,最短路径等等!

2011-10-03

qt 做的qq,界面话,效率高

不仅是学习的好代码,也是网络编程的好代码!涉及多线程!效率高!

2011-10-03

qt oracle的驱动

自己编译的oracle的驱动,纯天然的,最好是2010.05版本的,对于qt开源版,你有嫌麻烦的,就下一个把!

2011-10-03

3D游戏编程代码

一个dx学习的号代码,它加载了.x文件,界面不错!

2011-09-24

vc游戏编程电子书

有图,有代码,有步骤,step to step 透明贴图,双缓冲贴图,游戏框架

2011-09-12

vc++游戏编程

我刚学游戏编程用的就是他,从mfc开始,容易上进!

2011-09-12

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除