排序:
默认
按更新时间
按访问量

c++面试题:判断数组是否存在重复元素

Problem: given an array in length of N, in which theelements are integers distributed from 1 to N, please judge whether there isduplication quickly....

2014-05-22 23:09:38

阅读数:3991

评论数:1

Spark Softmax

本篇实现了spark上softmax算法,算法原理参考:http://deeplearning.stanford.edu/wiki/index.php/Softmax_Regression 训练样本采用稀疏形势表达,因此实现了2个类SparserVector和DenseMatrix分别表示稀疏...

2013-12-17 22:15:01

阅读数:1593

评论数:4

Spark LogisticRegression

由于spark中默认支持原生矩阵格式的输入,但实际中我们经常碰到的是稀疏的数据集,因此这里我实现了一个与libsvm输入格式相同的logistic回归,刚接触scala和spark,代码写的还不够简洁,还请各位指点。 代码如下: package classify import java.uti...

2013-12-15 19:57:19

阅读数:1276

评论数:0

scala学习资料

本篇会列举一些scala的学习资料,后续会不断更新 1. twitter公司发布的scala中文教程:http://twitter.github.io/scala_school/zh_cn/index.html

2013-12-11 10:31:18

阅读数:933

评论数:0

一些单机处理大数据开源工具

1. LibFM 项目主页:http://www.libfm.org/ 2. Svdfeature 项目主页:http://apex.sjtu.edu.cn/apex_wiki/svdfeature 3. Libsvm和Liblinear libsvm项目主页:http:/...

2013-12-01 22:28:11

阅读数:873

评论数:0

weka分类器-C4.5决策树

1.     算法概述  C4.5,是机器学习算法中的另一个分类决策树算法,它是决策树(决策树也就是做决策的节点间的组织方式像一棵树,其实是一个倒树)核心算法,是相对于ID3算法的改进,主要改进点有: 1.      用信息增益率来选择属性。C4.5克服了ID3用信息增益选择属性时偏向选择取值...

2013-03-09 22:05:27

阅读数:2780

评论数:0

weka分类器-NaiveBayes

Weka中实现一个分类器比较重要的有一下3个方法: buildClassifier(Instances instances) double[] distributionForInstance(Instanceinstance) double classifyInstance(Instance...

2013-03-08 17:04:35

阅读数:2650

评论数:0

weka源代码分析-总述

WEKA作为一个公开的数据挖掘工作平台,集合了大量能承担数据挖掘任务的机器学习算法,包括对数据进行预处理,分类,回归、聚类、关联规则以及在新的交互式界面上的可视化。 Weka是一个开源的软件,阅读并理解其源代码可以帮助我们更好的理解算法的细节,同时也能够扩展其算法以获得更广泛的应用。但是现在公开...

2013-03-07 21:32:15

阅读数:1618

评论数:0

提示
确定要删除当前文章?
取消 删除
关闭
关闭