《Python数据分析与数据挖掘实战》学习笔记2

1、Python数据导入

	- 导入scv数据
	- 导入Excel数据
	- 导入MySQL数据
	- 导入HTML数据
	- 导入文本数据

2、有明确类别的用分类算法,没有明确类别的用聚类算法;
3、数据分类处理的一般思路:

    明确需求,对数据进行观察;
	确定算法;
	确定步骤;
	编程实现;

4、常见分类算法:

  • KNN算法:

  • 贝叶斯方法
    贝叶斯网络又称信度网络,是Bayes方法的扩展,是目前不确定知识表达和推理领域最有效的理论模型之一。

  • 决策树
    决策树采用自顶向下的递归方式,在内部节点进行属性值比较,并根据不同的属性值从该节点向下分支,最终得到的叶结点是学习划分的类。

  • 人工神经网络

  • 支持向量机
    支持向量机是一种通过某种非线性映射,把低维的非线性可分转化为高维的线性可分,在高维空间进行线性分析的算法。
    5、回归分析

  • 线性回归
    适用于因变量和自变量是线性关系:对一个或多个自变量和因变量之间的线性关系进行建模,可用最小二乘求解模型系数。

  • 逻辑回归
    适用于因变量一般有1或0两种取值:是广义线性回归模型的特例,利用logistic函数将因变量的取值范围控制在0和1之间,表示取值为1的概率。

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值