机器学习
铲屎的胖虎
这个作者很懒,什么都没留下…
展开
-
机器学习——AdaBoost
Boosting算法AdaBoost是典型的Boosting算法,属于Boosting家族的一员。在说AdaBoost之前,先说说Boosting提升算法。Boosting算法是将“弱学习算法“提升为“强学习算法”的过程,主要思想是“三个臭皮匠顶个诸葛亮”。一般来说,找到弱学习算法要相对容易一些,然后通过反复学习得到一系列弱分类器,组合这些弱分类器得到一个强分类器。Boosting算法要涉及到两...原创 2019-12-14 17:41:46 · 598 阅读 · 0 评论 -
机器学习——SVM支持向量机
一、简介支持向量机(support vector machines)是一种二分类模型,它的目的是寻找一个超平面来对样本进行分割,分割的原则是间隔最大化,最终转化为一个凸二次规划问题来求解。模型包括:当训练样本线性可分时,通过硬间隔最大化,学习一个线性可分支持向量机;当训练样本近似线性可分时,通过软间隔最大化,学习一个线性支持向量机;当训练样本线性不可分时,通过核技巧和软间隔最大化,学习一个...原创 2019-11-30 21:11:58 · 495 阅读 · 0 评论 -
机器学习——逻辑回归
分类和回归是机器学习可以解决两大主要问题,从预测值的类型上看,连续变量预测的定量输出称为回归;离散变量预测的定性输出称为分类。逻辑回归(Logistic Regression)逻辑回归由于存在易于实现、解释性好以及容易扩展等优点,被广泛应用于点击率预估(CTR)、计算广告(CA)以及推荐系统(RS)等任务中。逻辑回归虽然名字叫做回归,但实际上却是一种分类学习方法。线性回归完成的是回归拟合任务,...原创 2019-11-30 20:25:17 · 218 阅读 · 0 评论 -
机器学习——朴素贝叶斯
朴素贝叶斯(Naive Bayes)是一种简单的分类算法。给定训练数据集(X,Y),其中每个样本x都包括n维特征,即x=(x1,x2,x3,…,xn),类标记集合含有k种类别,即y=(y1,y2,…,yk)。如果现在来了一个新样本x,我们要怎么判断它的类别?从概率的角度来看,这个问题就是给定x,它属于哪个类别的概率最大。那么问题就转化为求解P(y1|x),P(y2|x),…,P(yk|x)中最...原创 2019-11-30 19:58:20 · 746 阅读 · 0 评论 -
机器学习——K邻近算法
1、原理:对于一个给定的训练集,我们知道训练样本中的每组数据特征及其分类标签。然后输入没有标签的新数据,将新数据的每个特征与训练集中的每个特征进行比较,选取特征最相似(最近邻:k=1)的分类标签,一般来说,我们只选取前 k 个最相似的分类标签,这也是 k-近邻算法中 k 的由来,通常 k 不超过 20。最后,选择 k 个数据中出现次数最多的分类标签作为新数据的分类结果。K值的设定:K值设置过...原创 2019-11-15 22:27:51 · 202 阅读 · 0 评论 -
机器学习——决策树
一、决策树的构建决策树是数据挖掘中最重要且最常用的方法之一.在数据挖掘中,决策树主要有两种类型:分类树和回归树分类树输出的是样本的类标。回归树输出的是一个实数。构建决策树是一个自顶向下的过程。从包含所有数据的根节点开始,根据选取分裂属性的属性值把训练集划分成不同的数据子集,生成由每个训练数据子集对应新的非叶子节点。对生成的非叶子节点再重复以上过程,直到满足特定的终止条件。二、分裂属性的...原创 2019-11-15 21:14:40 · 423 阅读 · 0 评论