数据挖掘
数据挖掘方面的一些实现,尝试。
Hanzoe_lwh
我走的很慢,但绝不回头。
展开
-
数据挖掘知识点-决策树
简介 对于《数据挖掘导论》的学习总结,使用C4.5决策树。 正文 以C4.5为基础,决策树算法的一般过程如下: 给定一个表示为“属性-值”格式的数据集T。数据集由多个具有输入属性和一个输出属性的实例组成。 选择一个最能区别T中实例的输入属性,C4.5使用增益率来选择该属性。 使用该属性创建一个树节点,同时创建该节点的分支,每个分支为该节点的所有可能取值。 使用这些分支,将数据集中的实例进行分类,成为细分的字类。 将当前字类的实例集合设为T,对数据集中的剩余属性重复(2)~(3)步,直到满足一下两个条件之一原创 2020-10-16 15:21:16 · 628 阅读 · 0 评论 -
数据挖掘知识点总结-三个率以及混淆矩阵
简介 学习数据挖掘的知识点总结。 正文 一、 混淆矩阵 在介绍各个率之前,先来介绍一下混淆矩阵。如果我们用的是个二分类的模型,那么把预测情况与实际情况的所有结果两两混合,结果就会出现以下 4 种情况,就组成了混淆矩阵。 字母含义 T:Ture F:False P:Positive N:Nagetive 四个组合的解释 TP:实际为真的结果预测为真 FP:实际为假的结果预测为真 FN:实际为真的结果预测为假 FP:实际为假的结果预测为假 总结就是:前为真实,后为预测 二、三个率一条线 准确率 既原创 2020-10-16 13:22:19 · 617 阅读 · 0 评论