weka开发
文章平均质量分 92
红豆和绿豆
这个作者很懒,什么都没留下…
展开
-
Weka-filter类-选择样本[5]
目前有3个方法可以研究下:RemovePercentage,RemoveRange,RemoveWithValuesRemovePercentage:顾名思义,根据百分比选择样本RemoveRange:根据序号选择样本RemoveWithValues:根据某字段的设定值选择样本然后,为减少文章重复的内容,我们先看这几个方法的不同的转载 2017-03-17 15:11:48 · 1960 阅读 · 0 评论 -
Weka文件读取及导出
1,weka文件读取分3类,分别为:ARFF(weka自身文件读取),CSV(文本文件读取),数据库直接读取1.1,ARFF(weka自身文件读取),比较容易直接使用Instances类即可1.2,CSV文件读取需要使用dataSource类[java] view plain copyimp转载 2017-03-17 14:01:43 · 4693 阅读 · 2 评论 -
weka数据预测 分类回归 方法 参数 总结
1.线性回归(LinearRegression)1.1原理在统计学中,线性回归是利用称为线性回归方程的最小平方函数对一个或多个自变量和因变量之间关系进行建模的一种回归分析。这种函数是一个或多个称为回归系数的模型参数的线性组合。只有一个自变量的情况称为简单回归,大于一个自变量情况的叫做多元回归。1.2最小二乘法原理线性回归模型经常用最小二乘逼近来拟合,但他们也可能用别的方转载 2017-03-07 16:20:03 · 4029 阅读 · 1 评论 -
weka的二次开发
http://www.programcreek.com/java-api-examples/index.php?api=weka.classifiers.trees.RandomForesthttp://www.programcreek.com/java-api-examples/index.php?api=weka.filters.unsupervised.attribute.Tim转载 2017-03-07 14:09:01 · 634 阅读 · 0 评论 -
Java调用weka的各种聚类算法
package com.lh.cluster;import java.io.BufferedOutputStream;import java.io.File;import java.io.FileOutputStream;import java.io.PrintStream;import weka.clusterers.EM;import weka.clustere原创 2017-03-07 13:30:08 · 3802 阅读 · 0 评论 -
通过weka.jar包来进行数据预处理
打开eclipse ,在对应的工程下右击,选择Build Path ->选择Configure Build Path ->选择Libraries ->点击Add External JARs ->然后到你的jar包所在路径选择它。即可。一、特征选择[java] view plain copy print?package转载 2017-03-07 13:22:50 · 2971 阅读 · 0 评论 -
调用WEKA包进行kmeans聚类(java)
所用数据文件:data1.txt[plain] view plain copy print?@RELATION data1 @ATTRIBUTE one REAL @ATTRIBUTE two REAL @DATA 0.184000 0.482000 0.152000 0.转载 2017-03-07 13:10:57 · 2125 阅读 · 0 评论 -
java调用Weka中神经网络的算法(从数据库中取数据)
http://blog.csdn.net/shuijingyezihehe/article/details/38331005本文中使用的weka版本为3.6版本,参阅的API也是3.6的相关的包(weka.jar,weka-src.jar,libsvm.jar.wlsvm.jar)可以在以下链接下载:http://pan.baidu.com/s/1kTHW3un转载 2017-03-07 12:59:05 · 2454 阅读 · 2 评论 -
Java集成Weka做线性回归的例子
之前研究完分类的逻辑回归,继续搞一下线性回归看看。线性回归在数据挖掘领域应也是非常常见,即根据现有的数据集(行向量组成的矩阵),(训练)模拟出一个合适的规律(函数),来推测任何新给出的数据组合(向量)应该得到的值。具体的描述可以参见各种博客,怎么推导的看来看去一知半解,但总而言之结果也简单,就是计算得到一个“适当”的多元线性函数Y=a0+a1*x1+a2*x2+a3*x3+…+ak*xk。转载 2017-03-09 13:38:50 · 1436 阅读 · 0 评论 -
Canopy聚类算法
只有这个算法思想比较对,其他 的都没有一开始的remove: 原网址:http://www.shahuwang.com/?p=1021 Canopy Clustering 这个算法是2000年提出来的,此后与Hadoop配合,已经成为一个比较流行的算法了。确切的说,这个算法获得的并不是最终结果,它是为其他算法服务的,比如k-means算法。它能有效地降低k-means算法中计算点之间距离的转载 2017-03-09 09:43:22 · 1116 阅读 · 0 评论 -
调用WEKA包进行kmeans聚类(java)
所用数据文件:data1.txt[plain] view plain copy print?@RELATION data1 @ATTRIBUTE one REAL @ATTRIBUTE two REAL @DATA 0.184000 0.482000 0.152000 0.转载 2017-03-09 09:00:10 · 703 阅读 · 0 评论 -
Weka-无监督属性过滤器-AddExpression MathExpression
AddExpression过滤器是通过将一个数学函数应用于数值型属性而生成1个新的属性。其中,可以支持+、-、*、/、和^,函数log、abs、cos、exp、sqrt、floor、ceil、rint、tan、sin,属性通过索引加前缀a确定,例如a7表示第7个属性;MathExpression过滤器与AddExpression过滤器类似,该过滤器只是修改现有属性,不创建新属性。所转载 2017-03-17 16:08:06 · 1725 阅读 · 0 评论 -
weka数据集中特征的新增、删除、复制、添加ID
public class AttributeProcess {/*** 删除特征* 第一种方法,在remove类中设置option属性,-R 表示字段范围,删除1 2字段* Remove remove1=new Remove(); remove1.setOptions(new String[]{"-R","1,2"});原创 2017-03-17 15:26:13 · 3011 阅读 · 0 评论 -
weka-Oracle数据库连接及以ARFF文件导出[2]
weka 在 eclipse 直接连接Oracle 取数据,需要修改weka包中的配置文件。在使用weka包连接数据库前,我们先研究 eclipse 如何连接oracle取数据1,eclipse 连接oracle取数据[java] view plain copyimport java.sql转载 2017-03-17 14:04:24 · 413 阅读 · 0 评论