- 博客(6)
- 资源 (7)
- 收藏
- 关注
原创 决策树算法:CART
我们前面讲了两种决策树算法ID3ID3ID3和C4.5C4.5C4.5,还有一种比较经典的决策树算法就是CARTCARTCART,也叫分类回归树算法,它是一种二分递归分割算法,把当前样本划分为两个子样本,使得生成的每个非叶子结点都有两个分支,因此CART算法生成的决策树是结构简洁的二叉树。由于CARTCARTCART算法构成的是一个二叉树,因此它在每一步的决策时只能用是或者否,不管一个特征有多...
2018-10-19 12:05:41 371
原创 决策树算法:C4.5
前面我们讲到了ID3ID3ID3算法,也知道了如何选择决策树分裂的属性,但是有人发现ID3ID3ID3算法不能对连续的数据进行处理,只能将连续的数据离散化处理,同时ID3ID3ID3算法并没有做剪枝处理,导致决策树可能会过于复杂导致过拟合。于是在这个基础上衍生出了C4.5C4.5C4.5算法。 C4.5C4.5C4.5针对ID3ID3ID3主要做出了以下几种优化: 1. 通过信息增...
2018-10-19 09:18:05 438
原创 支持向量机:SVM
SVM 是一种监督式的机器学习算法,可用于分类或回归问题。它使用一种称为核函数的技术来变换数据,然后基于这种变换,算法找到预测可能的两种分类之间的最佳边界。通俗来讲,它是一种二类分类模型,其基本模型定义为特征空间上的间隔最大的线性分类器,即支持向量机的学习策略便是间隔最大化,最终可转化为一个凸二次规划问题的求解。1. 线性SVM 线性可分的二分类问题:上图中红色和蓝色分别表示不同...
2018-10-13 17:31:24 347
原创 逻辑回归:LR
逻辑回归简单说就是将数据拟合到一个logisticlogisticlogistic函数中,从而能够完成对事件发生的概率进行预测。虽然名字叫做回归,但是其实质上却是一个分类问题,主要适用于二分类。 逻辑回归算法速度快,适合二分类问题,容易理解,可直接看到各特征的权重,而且很容易更新模型吸收新的数据,但是对数据和场景的适应能力有局限性,不如决策树算法适应性那么强。 注:这里我就不讲逻辑回归...
2018-10-08 17:15:59 373
原创 基于朴素贝叶斯的情感分析
在上一张中我们简单的分析了一下朴素贝叶斯的原理和简单应用,我们提到了它主要使用在文本分析,邮件拦截,情感分析等等场景,这里我们就简单的做一个情感分析的处理。1. 数据搜集 这里的数据是我们从京东上爬的某种商品的好评和差评,这里就不详细讲解爬取的过程了。好评:差评:2. 数据处理 由上节我们知道,一个完整的文本不能直接拿来训练,所以在训练之前,我们需要将自己的语句分词,构建词...
2018-10-05 11:21:35 11891 15
原创 朴素贝叶斯:bayes
朴素贝叶斯分类是一种常用的分类算法,他根据研究对象的某些特征,来推断出该研究对象属于该研究领域的哪个类别。1. 概述 要了解朴素贝叶斯分类,就需要先知道贝叶斯分类定理,这就离不开条件概率,下面概率论中经典的条件概率公式:P(Y∣X)=P(X∣Y)P(Y)P(X)P(Y|X) = \frac{{P(X|Y)P(Y)}}{{P(X)}}P(Y∣X)=P(X)P(X∣Y)P(Y)根据上面的...
2018-10-04 16:38:59 881
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人