关闭

数据挖掘方法比较

标签: 数据挖掘
129人阅读 评论(0) 收藏 举报
分类:

一、可解释性和应用广泛性

1、决策树:简单直观,逻辑性强,易于理解和应用,广泛使用。

2、神经网络:可解释性差,远没有决策树和回归应用广泛。

3、Logistic回归:更为成熟、应用更为广泛,具有强大的活力和最广泛的业务应用基础。

二、缺失值和异常值敏感情况

1、决策树:对缺失值几乎不做处理即可应用,不易受到异常值影响。

2、神经网络:对缺失值敏感,需要对缺失值处理(赋值、替换或删除),对异常值和噪声不敏感。

3、Logistic回归:不能处理缺失值,需要对缺失值(赋值、替换或删除),对异常值敏感,应删除。

三、变量个数和质量的要求

1、决策树:本身就是挑选变量的过程。

2、神经网络:少而精。

3、Logistic回归:变量筛选(向前引入法、向后剔除法、逐步回归法)。

四、过拟合现象

相比于决策树和逻辑回归,神经网络可以挑选非线性关系,较好的拟合数据,也更容易过拟合。

五、模型诊断指标和措施

1、决策树:贪心算法。

2、神经网络,缺乏成熟的模型评判方案。

3、Logistic回归:丰富的指标判断(ROC、LIFT)。

0
0

查看评论
* 以上用户言论只代表其个人观点,不代表CSDN网站的观点或立场
    个人资料
    • 访问:34127次
    • 积分:1571
    • 等级:
    • 排名:千里之外
    • 原创:129篇
    • 转载:1篇
    • 译文:0篇
    • 评论:2条
    文章分类
    最新评论