数据处理实战:对ChiMerge问题的分析与实现

本文介绍了ChiMerge算法在数据挖掘中的应用,详细阐述了其自底向上、依赖卡方分析的工作原理。通过具体实例,以鸢尾花数据集为例,展示了使用matlab实现ChiMerge方法进行数据离散化的步骤,设置最大区间数为6。分析了ChiMerge算法的分裂点和最终区间,并提供了源程序文档。
摘要由CSDN通过智能技术生成

此问题与数据挖掘中的ChiMerge算法相关,用matlab程序实现。

问题描述

ChiMerge是监督的、自底向上的数据离散化方法。它依赖于卡方分析:具有最小卡方值的相邻区间合并在一起,直到满足确定的停止标准。

(1)简述ChiMerge如何工作。

(2)取鸢尾花数据集作为待离散化的数据集合,鸢尾花数据集可以从UCI机器学习数据库得到。使用ChiMerge方法,对四个数值属性分别进行离散化。(令停止条件为:max-interval=6)。你需要写一个小程序,以避免麻烦的数值计算。提交你的简要分析和检验结果:分裂点、最终的区间以及源程序文档。

<

  • 0
    点赞
  • 8
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值