weka数据预处理

最新推荐文章于 2024-01-14 14:47:45 发布

生产的驴

最新推荐文章于 2024-01-14 14:47:45 发布

阅读量676

点赞数

Weka数据预处理(一)

对于数据挖掘而言，我们往往仅关注实质性的挖掘算法，如分类、聚类、关联规则等，而忽视待挖掘数据的质量，但是高质量的数据才能产生高质量的挖掘结果，否则只有"Garbage in garbage out"了。保证待数据数据质量的重要一步就是数据预处理（Data Pre-Processing），在实际操作中，数据准备阶段往往能占用整个挖掘过程6~8成的时间。本文就weka工具中的数据预处理方法作一下介绍。

Weka 主要支持一种ARFF格式的数据，含有很多数据过滤方法。关于ARFF格式文件，可以在此处了解详情。

Weka的数据预处理又叫数据过滤，他们可以在weka.filters中找到。根据过滤算法的性质，可以分为有监督的（SupervisedFilter）和无监督的（UnsupervisedFilter）。对于前者，过滤器需要设置一个类属性，要考虑数据集中类的属性及其分布，以确定最佳的容器的数量和规模；而后者类的属性可以不存在。同时，这些过滤算法又可归结为基于属性的（attribute）和基于实例的(instance)。基于属性的方法主要是用于处理列，例如，添加或删除列；而基于实例的方法主要是用于处理行，例如，添加或删除行。

数据过滤主要解决以下问题（老生常谈的）：

数据的缺失值处理、标准化、规范化和离散化处理。

数据的缺失值处理：weka.filters.unsupervised.attribute.Replace

最低0.47元/天解锁文章

关注

0
点赞
踩
5

收藏

觉得还不错? 一键收藏
0
评论
weka数据预处理

Weka数据预处理(一)对于数据挖掘而言，我们往往仅关注实质性的挖掘算法，如分类、聚类、关联规则等，而忽视待挖掘数据的质量，但是高质量的数据才能产生高质量的挖掘结果，否则只有"Garbage in garbage out"了。保证待数据数据质量的重要一步就是数据预处理（Data Pre-Processing），在实际操作中，数据准备阶段往往能占用整个挖掘过程6~8成的时间。本文就weka工具中...
复制链接

扫一扫

生产的驴 CSDN认证博客专家 CSDN认证企业博客

码龄9年

153: 原创

-: 周排名

111万+: 总排名

140万+: 访问

: 等级

7954: 积分

5335: 粉丝

302: 获赞

16: 评论

1838: 收藏

私信

关注

热门文章

最新评论

iOS基础之动画
CSDN-Ada助手: 哇, 你的文章质量真不错，值得学习！不过这么高质量的文章, 还值得进一步提升, 以下的改进点你可以参考下: (1)增加除了各种控件外，文章正文的字数；(2)增加条理清晰的目录；(3)使用更多的站内链接。
深入理解Tomcat系列之五：Context容器和Wrapper容器
m0_63435319: 16.helloapp应用中的test1.jsp文件的源代码如下: <% String username= request.getParameter("username"); out.print0; <% 当客户端访问 http://localhost:8080/helloapp/test1.js p?username=Cat会出现什么情况？(单选) () A Servlet容器(Tomcat)向客户端返回编译错误因为无法识别request变量和out变量。 B test1.jsp向客户端输出"Cat"。 C Servlet溶容器(Tomcat)向客户端返回编译错误因为无法识别username参数。 D test1.jsp向客户端输D 出"null"。
深入理解Tomcat系列之五：Context容器和Wrapper容器
m0_63435319: 16.helloapp应用中的test1.jsp文件的源代码如下: <% String username= request.getParameter("username"); out.print0; <% 当客户端访问 http://localhost:8080/helloapp/test1.js p?username=Cat会出现什么情况？(单选) () A Servlet容器(Tomcat)向客户端返回编译错误因为无法识别request变量和out变量。 B test1.jsp向客户端输出"Cat"。 C Servlet溶容器(Tomcat)向客户端返回编译错误因为无法识别username参数。 D test1.jsp向客户端输D 出"null"。
Drupal 7.31SQL注入getshell漏洞利用详解及EXP
KaliWantAttack: 有点不明白，意思是前提得有管理员权限对吗？那如果有管理员权限的话更直接的就是开启上传功能，然后传小马过去，再拿菜刀连就完事儿了。
SpringMVC工作原理
嘴角上扬~~~: SpringMVC流程 8，9 ViewReslover拼错啦，应该是ViewResolver

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。