R语言决策树（ID3）

最新推荐文章于 2024-03-31 01:07:02 发布

小邢不会JAVA

最新推荐文章于 2024-03-31 01:07:02 发布

阅读量464

点赞数 1

文章标签： r语言决策树开发语言

本文链接：https://blog.csdn.net/weixin_51825271/article/details/127874421

版权

数据来源自《数据挖掘：方法与应用》

导入Rstudio中：

library(tidyverse)
df = readxl::read_xlsx("datas/student.xlsx")

* 将Age中的<=30、31-40，>40记作1、2、3

ID3算法：

离散型随机变量 𝑋 的概率分布为 𝑃(𝑋 = 𝑥 𝑖 ) = 𝑝 𝑖 , 𝑖 = 1, ⋯ , 𝑛 , 则其熵定义为：

$I(s_1,s_2,...,s_n)=-\Sigma_{i=1}^{m}p_ilog_2 p_i$

calEntropy = function(Y) { # 计算因变量 Y 分组下的经验熵
  p = table(Y) / length(Y)
  - sum(p * log2(p))
}

属性A的信息熵定义为：

$E(A)=\Sigma_{i=1}^n \frac{|D_i|}{D}I$

calCondEntropy = function(A, Y) {
  p = table(A) / length(A)
  H = tapply(Y, A, calEntropy)
  sum(p * H)
}

# 计算各个特征对结果变量 Y 的信息熵
HDA = map_dbl(df[2:5], calCondEntropy, Y = df$buys_computer)
HDA

输出如下：

age             income       student    credit_rating 
0.6935361     0.9110634     0.7884505     0.8921589

课本给出的参考结果如下：

计算信息增益：

$Gain(A)=I(A)-E(A)$

> gDA = HD - HDA
> gDA
          age        income       student credit_rating 
   0.24674982    0.02922257    0.15183550    0.04812703

课本参考值：

参考资料: [1] 张敬信.2021.R机器学习课件

[2]徐华.数据挖掘：方法与应用.清华大学出版社.2014

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

小邢不会JAVA

关注关注

1
点赞
踩
4

收藏

觉得还不错? 一键收藏
打赏
1
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

【决策树】ID3算法理解与R语言实现

Gavin Chen的专栏

12-20

8944

用R语言自带包实现决策树，以及自定义函数来实现决策树算法。

ID3决策树（R实现）

xiaohukun的博客

09-21

2561

说明 1.参考文章：R语言实现决策树ID3算法 2.补充了分类预测的函数部分 3.采用数据框模拟xml文件的方式存储决策树 代码训练集（train_data） outlook temperature humidity windy play sunny hot high FALSE no sunny hot high ...

1 条评论您还未登录，请先登录后发表或查看评论

R语言决策树（ID3、CART、C4.5、C5.0）算法使用举例

Zheng.C.F的博客

09-17

8516

1、环境及数据准备 #环境变量 rm(list = ls());#清空变量空间 #载入所需R Rackages library(rattle) library(rpart) library(rpart.plot) library(RWeka) library(party) library(partykit) library(C50) library(export) #-----------...

基于 ID3 算法的决策树概念+代码(R语言)+例子 -保姆级别手算教程

一只松鼠怪的博客

05-23

2996

基于 ID3 算法的决策树 -Iterative Dichotomiser 3 目录基于 ID3 算法的决策树 -Iterative Dichotomiser 3ID3 概念算法判断最佳决策点首先介绍Entropy 的概念通过ID3建立决策树模型应用 ID3 概念 ID3算法是由Ross Quinlan基于奥卡姆剃刀理论（Occam’s razor）所设计的一种追求精简的决策树。该算法使用一种从上到下，从root 到leaf的贪心算法区分数据建立决策树。算法分类过程计算数据中所有特征的inform

ID决策树（R实现）

09-21

采用R语言实现的ID3决策树，包括了模型训练函数和分类预测函数。使用数据框模拟xml文件存储决策树，实现了ID3的分类功能。

r语言c5.0决策树算法参数,R语言：决策树ID3/C4.5/CART/C5.0算法的实现

weixin_27134143的博客

05-18

1660

在前文中，我们已经详细介绍了决策树算法中的ID3/C4.5/CART算法的原理，以及决策树的剪枝问题。ID3算法戳我C4.5算法戳我CART算法戳我决策树剪枝问题戳我本文将详细介绍如何用R语言实现决策树算法。算法区分要点R包ID3使用信息增益rpart包中rpart函数C4.5使用信息增益RWeka包中J48()CART使用ginirpart包中rpart函数C5.0C4.5的改进，比较适合于大规...

R语言：决策树ID3/C4.5/CART/C5.0算法的实现

海军上将光之翼的博客

02-21

1万+

在前文中，我们已经详细介绍了决策树算法中的ID3/C4.5/CART算法的原理，以及决策树的剪枝问题。 ID3算法戳我 C4.5算法戳我 CART算法戳我 决策树剪枝问题戳我本文将详细介绍如何用R语言实现决策树算法。数据简介本文数据选择了红酒质量分类数据集，这是一个很经典的数据集，原数据集中“质量”这一变量取值有{3，4，5，6，7，8}。为了实现二分类问题，我们添加一个变量“等级”，并将“...

R语言决策树（1）

最新发布

2301_78852561的博客

03-31

1385

数据集heart_learning.csv与heart_test.csv是关于心脏病的数据集，heart_learning.csv是训练数据集，heart_test.csv是测试数据集。循环的思想是用建立的决策树fit.tree中子树矩阵每个子树对应的复杂度参数CP去修剪决策树，得到每个修剪后的子树，用这些修剪后的子树去验证分层随机抽样后的数据集valid，得到了预测概率和分类结果，与实际真值进行比对，得到了预测准确率，数据框results有两列，一列是每个子树的CP值，一个是验证准确率。

决策树ID3源码和数据

08-23

对照Python3进行代码修改，实现ID3算法

决策树的R语言实现

11-17

数据挖掘方法中的决策树方法，在R语言上如何实现，

R_Studio(cart算法决策树)对book3.csv数据用测试集进行测试并评估模型

weixin_30314813的博客

10-20

471

对book3.csv数据集，实现如下功能：　　（1）创建训练集、测试集　　（2）用rpart包创建关于类别的cart算法的决策树 　　（3）用测试集进行测试，并评估模型　　book3.csv数据集 setwd('D:\\data') list.files()　 ...

R语言学习系列(数据挖掘之决策树算法实现--ID3代码篇)

栖客

11-17

2620

转载自：http://blog.csdn.net/hawksoft/article/details/7760868 1、辅助类，用于计算过程和结果存储 [csharp] view plaincopyprint? /// /// 决策树节点. /// public class DecisionTree

R语言 决策树及其实现

zxy_clover的博客

03-22

1万+

一颗决策树包含一个根结点、若干个内部结点和若干个叶结点；叶结点对应于决策结果，其他每个结点则对应于一个属性测试；每个结点包含的样本集合根据属性测试的结果被划分到子结点中；根结点包含样本全集。从根结点到叶结点的路径对应于了一个判定测试序列。目的：为了产生一颗泛化能力强，即处理未见示例能力强的据决策树。特别注意几点：1）通常所说的属性是离散，若属性是连续，则要把属性离散化，最简单的是是采用二分法（找划...

R语言学习(三)——决策树分类

EverestRs的博客

11-04

1万+

分类分类（Classification）任务就是通过学习获得一个目标函数（Target Function）f, 将每个属性集x映射到一个预先定义好的类标号y。分类任务的输入数据是记录的集合，每条记录也称为实例或者样例。用元组(X,y)表示，其中，X 是属性集合，y是一个特殊的属性，指出样例的类标号（也称为分类属性或者目标属性）。解决分类问题的一般方法分类技术是一种根据输入数据集建立分类模型...

决策树ID3;C4.5详解和python实现与R语言实现比较

crystal_tyan

12-24

9012

把决策树研究一下，找来了一些自己觉得还可以的资料：分类树（决策树）是一种十分常用的分类方法。他是一种监管学习，所谓监管学习说白了很简单，就是给定一堆样本，每个样本都有一组属性和一个类别，这些类别是事先确定的，那么通过学习得到一个分类器，这个分类器能够对新出现的对象给出正确的分类。这样的机器学习就被称之为监督学习。分类本质上就是一个map的过程。C4.5分类树就是决策树算法中最流行的一种

09#R语言实现决策树分析