Weka学习2-数据预处理

最新推荐文章于 2024-08-21 20:36:21 发布

aperson111

最新推荐文章于 2024-08-21 20:36:21 发布

阅读量5k

点赞数

分类专栏： weka 文章标签：数据挖掘 attributes 算法数据结构 filter

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/aperson111/article/details/7267486

版权

weka 专栏收录该内容

3 篇文章 1 订阅

订阅专栏

Weka学习2-数据预处理

数据预处理是所有数据挖掘算法的前提基础。拿到一个数据源，不太可能直接用于数据挖掘算法。

为了既不破坏业务数据的数据结构，又能为数据挖掘算法所使用，就需要进行数据预处理的过程，将数据源进行一定的处理，得到数据挖掘算法的输入数据。

在上一篇，讲到数据加载。

加载数据后，就进入数据预（preprocess）处理页面，个部分使用说明如下

（1） Filter（过滤器）

提供了多种数据筛选方式。

以离散化为例，简要说明该过程

点击“choose”按钮，出现过滤器结构树。选择“unsupervised”-“Discretize”即可

选中后，点击右边的Discretize区域，出现选择框，对参数进行设置。

attributeIndices:选择数据源的某几个属性进行离散化。比如1,2。或者first-last

bins:对离散化的区间数量进行规定

点击“apply”按钮，开始离散化。

（2）Attributes（属性）

可以查看某一个具体属性的内容

点击下面的“Remove”按钮，可对属性进行删除。

选中某一个属性，在右边的selectedattribute一栏可以查看其说明。包括类型，数据内容等

离散化前数据类型是数值型（numeric），离散化操作后的属性就变成了分类型（nominal）。

（3）保存

点击上方的“save”按钮，即可将预处理的结果保存为arff文件。这是weka分析数据的输入格式。

关注

0
点赞
踩
4

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。