数据挖掘 模型的衡量标准与建模

一般来说,建模是循环做的。

一、模型的衡量标准

1、generating a good model

准确性Accurate
稳定性stable

对同一个样本的预测值是唯一的,稳定的

推广性general

建模使用的数据决定了模型的推广性。

2、Ease of Use 是否好用

generate a fit
measure accuracy

分类:混淆矩阵,ROC、AUC;
回归:均方差;

make predictions

预测

switch algorithm

神经网络一组模型,可以自己设计出一套模型

share results

模型的可解释性

3、Feature selection

变量的筛选,过滤无关变量,保证模型的效果

uncorelated predictor:
corelated predictor:

二、模型分类:

1、回归问题

得到一个数字(x,y)

多元线性回归
多元非线性回归
广义线性回归模型

(eg 逻辑回归,不满足线性回归条件,但是很解决。y值不连续)

神经网络***
曲线拟合

2、分类问题

得到一个类别 (x,y)

神经网络
逻辑回归

(逻辑回归得到一个概率值,可以用作分类。判断阈值可以根据业务条件进行设置)

判别分析
朴素贝叶斯分类
SVM
决策树
组合算法

3、聚类问题

得到一推样本 (x) 将样本聚成几堆,不清楚什么是y

K均值聚类
系统聚类
神经网络
模糊C均值聚类
高斯混合算法
  • 1
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值