《数据挖掘》策略

  1. 数据挖掘策略可以广义地分为有指导和无指导两类;
  2. 有指导学习通过使用输入属性来预测输出属性值的方式建模,有许多有指导数据挖掘算法仅允许单个输出属性;
    由于其输出属性的结果依赖于一个或多个输入属性值,故输出属性又称为因变量; 所有用于建模的属性都是自变量
  3. 有指导学习策略可以按照输出属性是离散的还是分类的,以及设计的模型是用来确定当前条件还是预测未来结果,进一步分类

  4. 【分类】,可能是所有数据挖掘策略中最耗理解的,一般有三个特征:
    (1)学习是有指导的
    (2)因变量是分类的
    (3)重点在于建立模型,将新的实例指派给一组定义明确的类中的一个
    每个例子处理的都是当前的而不是未来行为
  5. 【估计】,目的在于确定一个未知输出属性的值;然而与分类模型不同的是,对于一个估计问题,其输出属性值(一个或多个)是数值的而不是分类的
  6. 【预测】,与分类模型和估计模型不同的是,预测模型的目的在于确定未来的输出结果而不是当前的行为; 预测模型的输出属性(一个或多个)可以使分类的或数值型的
  7. 规则准确度,是指在前面的前提条件下,输出属性正确的概率为多少;
    规则覆盖率,是指在当前的实例中,复合这些前提条件的实例比例
  8. 【无指导聚类】,我们没有因变量来指导学习过程,相反,学习规程通过使用聚类质量度量将实例分为两个或更多个类,来建立知识结构; 无指导聚类策略的主要目的在于发现数据中的概念结构
    作用在于:(1)确定能否在数据中发现概念形式的有意义的关系;(2)评估一个有指导学习模型的性能(3)确定有指导学习的最佳输入属性集合(4)侦测孤立点
  9. 【购物篮分析】,目的是找到零售产品之间有趣的关系
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值