Python数据分析与挖掘实战学习笔记(三)

本次学习笔记重点介绍数据分析中的挖掘建模:

经过数据探索与数据预处理,得到了可以直接建模的数据,根据挖掘目标和数据形式可以建立分类与预测、聚类分析、关联规则、时序模式和偏差检测等模型。

1.分类与预测

分类和预测是预测问题的两种主要类型,分类主要是预测分类标号(离散属性),而预测主要是建立连续值函数模型,预测给定自变量对应的因变量的值。

1.1实现过程

(1)分类是构造一个分类模型,输入样本的属性值,输出对应的类别,将每个样本映射到先定义的类别。

分类模型建立也在已有标记的数据集上,模型在已有样本上的准确率可以方便的计算,属于有监督的学习。

(2)预测是指建立两种及以上变量间相互依赖的函数模型,然后进行预测或者控制。

(3)实现过程

分类第一步是学习步,通过归纳分析训练样本集来建立分类模型得到分类规则,第二部是分类步,先用一直的测试样本集评估分类规则的准确率,进行预测。

而预测第一步通过训练集建立起预测属性的函数模型,第二部在模型通过检验后进行预测或控制。

1.2常见的分类与预测算法

①回归分析:回归分析是确定预测属性(数值型)与其他变量间相互依赖的定量关系最常见的统计学方法包括线性非线性回归、Logistic回归、岭回归、主成分回归、偏最小二乘法回归等。

②决策树:采用自顶向下的递归方法,在内部节点进行属性值的比较,并根据不同的属性值,从该节点向下分支,最终得到的叶节点是学习划分的类。

③人工神经网络:人工神经网络是一种模仿大脑神经网络结构和功能而建立的信息处理系统&#x

  • 0
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值