weka
我是一只小兔纸咿呀咿呀呦
To be a better me
展开
-
weka怎么把csv文件转化成arff文件
ARFF文件是Weka默认的储存数据集文件。每个ARFF文件对应一个二维表格。表格的各行是数据集的各实例,各列是数据集的各个属性。下面是Weka自带的“weather.arff”文件,在Weka安装目录的“data”子目录下可以找到。 需要注意的是,在Windows记事本打开这个文件时,可能会因为回车符定义不一致而导致分行不正常。推荐使用UltraEdit这样的字符编辑软件察看ARFF原创 2013-08-28 18:30:37 · 14475 阅读 · 0 评论 -
weka的重新编译和添加算法
weka的重新编译与添加算法weka源码编译步骤1 安装JDK环境和Java开发环境,例如Eclipse。2 安装WEKA(安装不带JRE的WEKA即可)。3 重新编译:3.1 创建工作目录。新建任意一目录在任意位置(在Eclipse的workspace中或桌面,打开myeclipse时选该文件夹即可原创 2013-08-28 18:35:55 · 2317 阅读 · 0 评论 -
weka使用
经过这两天weka的使用,发现:1,各种方法必须在打开一个文件之后才能使用,而且这个文件是arff类型的;2,weka的association中的Apriori等方法是不支持数值类型的,所以文件中有数值类型的时候,应该先在preprocess里离散化,例如,如果你选bins=3,就是取两个值a,b,(不知道weka是怎么取这两个值得),然后它把数据给你分成三段,“-inf到a”,"a,b"原创 2013-08-28 18:42:52 · 845 阅读 · 0 评论 -
weka安装和配置
一、WEKA的安装在WEKA的安装文件中有weka-3-5-7.exe和weka-3-5-7jre.exe,这两个软件我们安装一个即可,它们的区别是weka-3-5-6.exe只安装WEKA,而weka-3-5-7jre.exe是将WEKA和JRE一起安装,所以在安装之前我们应该首先检查一下我们的电脑中是否安装了JRE,如果本机中已经安装了JRE,那么我们就选择weka-3-5-6.exe转载 2013-08-28 18:24:48 · 1792 阅读 · 0 评论 -
weka中对数值型数据离散化
连续数值离散化大致可分为:1)有监督(supervised)和2)无监督(unsupervised)两类。有监督方法可通过设定类别相关目标函数如:分类错误率,熵增益等指标结合二叉树算法对特征空间进行划分。这类方法的核心思想就是是每类样本尽量分布在特征空间中的不同子划分中。 无监督方法由于没有考虑类别信息,因此其核心思想是使得每个子划分空间的样本分布尽量均匀,具体可以采用等间隔、等密度或原创 2013-08-29 14:14:09 · 9863 阅读 · 2 评论 -
兴趣度度量规则
首先我们来温习一下Apriori的有关知识。对于一条关联规则L->R,我们常用支持度(Support)和置信度(Confidence)来衡 量它的重要性。规则的支持度是用来估计在一个购物篮中同时观察到L和R的概率P(L,R),而规则的置信度是估计购物栏中出现了L时也出会现R的条件概率 P(R|L)。关联规则的目标一般是产生支持度和置信度都较高的规则。 有几个类似的度量代替置信度来衡量规则的原创 2013-08-29 14:18:53 · 5306 阅读 · 0 评论 -
weka之属性选择
想用weka做一下特征选择,但是网上搜索 一下,大家都是在讲weka属性选择的算法。。晕死,weka 里面都有算法,直接用一下就完事了嘛。。。偶想知道的是weka做特征选择对属性有什么要求之类的了。。。有木有人知道啊 还有交叉验证,在数据缺乏的情况下,怎么办呢? 属性选择时就用use full training好了,交叉验证的结果没看明白。。原创 2014-02-24 15:20:20 · 1292 阅读 · 0 评论