数据挖掘导论-分类

分类 ,classification,分类任务就是通过学习得到一个目标函数(target function),把每个属性集x映射到一个预先定义的类标号y。

目标函数也称为分类模型(classification model)

决策树,decistion tree

1.概念

决策树是一种由节点和有向边组成的层次结构,树中包含三类节点

(1)根节点,root node ,没有入边,但有0条或者多条出边

(2)内部节点,internal node,恰有1条入边和两条或者多条出边

(3)叶结点,leaf node,或终结点 terminal node ,恰有一条入边,但没有出边

 

在决策树中。每个叶结点都赋予一个类标号,非终结点包含属性测试条件,用以分开不同特征的记录。

 

2.如何建立决策树

原则上讲,对于给定的属性集,可以构造的决策数目达指数级。通常采用贪心策略来构造次最优决策树,在选择划分数据的属性时,采取一系列局部最优决策来构造决策树。Hunt算法为例。Hunt算法是很多决策树算法基础,包括ID3/C4.5和CART.

 

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值