数据挖掘
jazwoo
这个作者很懒,什么都没留下…
展开
-
Weka入门教程(2)
3.数据准备 使用WEKA作数据挖掘,面临的第一个问题往往是我们的数据不是ARFF格式的。幸好,WEKA还提供了对CSV文件的支持,而这种格式是被很多其他软件所支持的。此外,WEKA还提供了通过JDBC访问数据库的功能。 在这一节里,我们先以Excel和Matlab为例,说明如何获得CSV文件。然后我们将知道CSV文件如何转化成ARFF文件,毕竟后者才是WEKA支持得最好的文件格式。面转载 2013-07-28 15:12:13 · 1064 阅读 · 0 评论 -
Weka入门教程(3)
3. 分类与回归 背景知识 WEKA把分类(Classification)和回归(Regression)都放在“Classify”选项卡中,这是有原因的。 在 这两个任务中,都有一个目标属性(输出变量)。我们希望根据一个样本(WEKA中称作实例)的一组特征(输入变量),对目标进行预测。为了实现这一目的, 我们需要有一个训练数据集,这个数据集中每个实例的输入和输出都是已知的。观察训练集中转载 2013-07-28 15:12:47 · 2252 阅读 · 0 评论 -
Weka入门教程(1)
目录 1. 简介2. 数据格式3. 数据获取与预处理3. 关联规则(购物篮分析)4. 分类与回归5. 聚类分析1. 简介 WEKA的全名是怀卡托智能分析环境(Waikato Environment for Knowledge Analysis),它的源代码可通过http://www.cs.waikato.ac.nz/ml/weka 得到。同时weka也是转载 2013-07-28 15:11:30 · 719 阅读 · 0 评论 -
极大似然估计和贝叶斯估计
极大似然估计和贝叶斯估计分别代表了频率派和贝叶斯派的观点。频率派认为,参数是客观存在的,只是未知而矣。因此,频率派最关心极大似然函数,只要参数求出来了,给定自变量X,Y也就固定了,极大似然估计如下所示:D表示训练数据集,是模型参数相反的,贝叶斯派认为参数也是随机的,和一般随机变量没有本质区别,正是因为参数不能固定,当给定一个输入x后,我们不能用一个确定的y表示输出结转载 2013-11-18 14:59:51 · 733 阅读 · 0 评论