![](https://img-blog.csdnimg.cn/20201014180756916.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
机器学习-算法
文章平均质量分 74
hellowuxia
这个作者很懒,什么都没留下…
展开
-
线性模型
1.基本模式 X=(x1,x2,x3,…,xn),线性模型试图学得一个通过属性的线性组合进行预测的函数: f(X) = w1x1 + w2x2 + … + wnxn + b 用向量形式: f(x)=wTx + b W和b学得之后,模型就可以确定。eg:若在西瓜问题中学得, f好瓜(X) = 0.2X色泽 + 0.5 X根蒂 + 0.3 X敲声 + 1 表明:综合考虑色泽、根蒂、敲声来原创 2017-02-28 18:08:19 · 830 阅读 · 0 评论 -
半监督学习
1.简介半监督学习(Semi-Supervised Learning,SSL)是模式识别和机器学习领域研究的重点问题,是监督学习与无监督学习相结合的一种学习方法。半监督学习:让学习器不依赖外界交互、自动地利用未标记样本来提升学习性能。它主要考虑如何利用少量的标注样本和大量的未标注样本进行训练和分类的问题。主要分为半监督分类,半监督回归,半监督聚类和半监督降维算法。2.基本假设要利用未标记样本,必然要原创 2017-03-26 12:09:19 · 7149 阅读 · 0 评论 -
机器学习——模型评估与选择
1.拟合:接近目标的远近程度。 过拟合:学习能力过强导致过于拟合。过于学习学到认为女生必须是长头发。 欠拟合:学习能力低下导致欠拟合。学习能力低下,拥有长发的都是女生。2.评估方法: 目标:所选模型的泛化误差最小 一、留出法 Step 1: 将数据集D 互斥 的分成训练集S和测试集T,D=SUT。 Step 2:运行,得评估结果 多次循环Step1、Step2 最后,取多次重复实验原创 2017-02-27 16:34:29 · 581 阅读 · 0 评论 -
CART(Classification And Regression Tree)
CART算法(Classification And Regression Tree)http://blog.csdn.net/u014568921/article/details/45082197 https://wenku.baidu.com/view/286c19dae009581b6bd9eb59.html http://www.dataguru.cn/article-4720-1.htm原创 2017-11-18 16:07:31 · 2924 阅读 · 0 评论 -
决策树
1.定义: 决策树是基于树形结构进行决策的一种机器学习方法。在机器学习中,决策树是一个预测模型,他代表的是对象属性与对象值之间的一种映射关系。一般,一颗决策树包含一个根结点、若干个内部结点和若干个叶节点。叶节点对应于决策结果,其他每个节点对应于一个属性测试。每个结点包含的样本集合根据属性测试结果被划分到子节点中;根结点包含全部样本集。从根结点到每个叶结点的路径对应了一个判定测试序列。决策树的生成是原创 2017-03-02 22:20:08 · 3626 阅读 · 1 评论 -
GSP算法
GSP算法(Generalized Sequential Pattern mining algorithm)https://wenku.baidu.com/view/19ee9abd960590c69ec376c6.html http://www.doc88.com/p-999957186220.html Mining Sequential Patterns: Generaliz原创 2017-11-15 21:35:58 · 6073 阅读 · 0 评论 -
集成学习
1.个体与集成集成学习通过构建并结合多个学习器来完成学习任务,有时也称多分类器学习、基于委员会的学习等。集成中只包含同种类型的个体学习器,这样的集成是同质的。同质集成中的个体学习器亦称“基学习器”,相应的学习算法称为“基学习算法”。集成中包含不同类型的个体学习器,这样的集成是“异质”的。异质集成中的个体学习器由不同的学习算法生成,这时就不再有基学习算法,相应的个体学习器常称为“组件学习器”或直接称为原创 2017-04-07 17:01:23 · 1551 阅读 · 0 评论 -
线性回归
线性回归(Linear Regression)https://baike.baidu.com/item/%E7%BA%BF%E6%80%A7%E5%9B%9E%E5%BD%92/8190345?fr=aladdin https://www.cnblogs.com/GuoJiaSheng/p/3928160.html一、介绍线性回归是利用数理统计中回归分析,来确定两种或两种以上变量间相互依赖的定量关原创 2017-11-24 22:11:54 · 1058 阅读 · 0 评论 -
聚类(下)
1.原型聚类 原型聚类亦称“基于原型的聚类”(prototype-based clustering),此类算法假设聚类结构能通过一组原型刻画,在现实聚类任务中常用。通常,算法先对原型进行初始化,然后对原型进行迭代更新求解。1)K-Means算法 (距离平方和最小聚类法)给定样本集D={x1,x2,…,xm},“k均值”算法针对聚类所得簇划分C={C1,C2,…,Ck}最小化均方误差: 直观来看,上原创 2017-03-24 20:53:57 · 3388 阅读 · 0 评论 -
聚类(上)
1.概述 聚类分析(cluster analysis)是将样品个体或指标变量按其具有的特性进行分类的一种统计分析方法。对样品进行聚类,称为样品(Q型)聚类分析。其目的是将分类不明确的样品按性质相似程度分成若干组,从而发现同类样品的共性和不同类样品间的差异。对指标进行聚类,称为指标(R型)聚类分析。其目的是将分类不明确的指标按性质相似程度分成若干组,从而在尽量不损失信息的条件下,用一组少量的指标来代原创 2017-03-24 15:33:42 · 817 阅读 · 0 评论 -
贝叶斯分类器(中)
EM算法翻译 2017-04-08 18:11:41 · 222 阅读 · 0 评论 -
多分类学习
1.基本思想: 考虑到N个类别C1,C2,…,Cn, 多分类学习的基本思路:拆解法,即将多分类任务拆解为若干个二分类任务求解。 具体讲,先对问题进行拆分,然后为拆出的每个二分类任务训练一个分类器。在测试时,对这些分类器的预测结果进行集成以获得最终的多分类结果。2.拆分策略 给定数据集D={(x1,y1),(x2,y2),…,(xm,ym)},yi属于{C1,C2,…,CN}: 1)一对一(原创 2017-02-28 21:19:13 · 3440 阅读 · 0 评论 -
支持向量机(上)
1.简介在机器学习领域,支持向量机SVM(Support Vector Machine)是一个有监督的学习模型,通常用来进行模式识别、分类以及回归分析。其原理从线性可分说起,然后扩展到线性不可分的情况。甚至扩展到使用非线性函数中去,这种分类器被称为支持向量机(Support Vector Machine,简称SVM)。SVM的主要思想可以概括为两点: 1)它是针对线性可分情况进行分析,对于线性不可原创 2017-03-19 12:27:10 · 800 阅读 · 0 评论 -
支持向量机(中)
SVM思路:简单情况,线性可分,把问题转化为一个凸优化问题,可以用拉格朗日乘子法简化,然后用既有的算法解决。复杂情况,线性不可分,用映射函数将样本投射到高维空间,使其变成线性可分的情形。利用核函数来减少高维度计算量。1.核函数 实质上是一种映射函数,将低维空间非线性问题映射到高维空间编程线性问题进行处理.许多在低维空间难以处理的非线性分类问题,转换到高维空间和容易得到最优分类超平面,这是其最翻译 2017-03-19 16:44:27 · 601 阅读 · 0 评论 -
机器学习简介
1.简介: 专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。 现实生活中,人们会根据经验得到一些结论进而进行预测。在计算机系统中,“经验”以“数据”的形式存在。因此,机器学习研究的主要内容:关于在计算机上从“数据”中产生“模型”的算法,即学习算法。2.从输出角度看: 若欲预测的值是离散值,如“好瓜”“坏瓜”,此类学原创 2017-02-27 11:38:46 · 484 阅读 · 0 评论 -
支持向量机(下)
1.分类与回归其实回归问题和分类问题的本质一样,都是针对一个输入做出一个输出预测,其区别在于输出变量的类型。分类问题:,给定一个新的模式,根据训练集推断它所对应的类别(如:+1,-1),是一种定性输出,也叫离散变量预测;回归问题:给定一个新的模式,根据训练集推断它所对应的输出值(实数)是多少,是一种定量输出,也叫连续变量预测。举个例子:预测明天的气温是多少度,这是一个回归任务;预测明天是阴、晴还是雨翻译 2017-03-19 17:55:15 · 207 阅读 · 0 评论 -
特征选择
特征选择原创 2017-03-20 16:17:36 · 363 阅读 · 0 评论 -
贝叶斯分类器(上)
1.简介贝叶斯分类器的分类原理:通过某对象的先验概率,利用贝叶斯公式计算出其后验概率,即该对象属于某一类的概率,选择具有最大后验概率的类作为该对象所属的类。贝叶斯决策论(Bayesian decision theory)是概率框架下实施决策的基本方法。对分类任务来说,在所有相关概率都已知的情形下,贝叶斯决策论考虑如何基于这些概率和误判损失来选择最优的类别标记。也就是说,贝叶斯分类器是最小错误率意义上原创 2017-04-08 17:28:45 · 710 阅读 · 0 评论 -
逻辑回归( Logistic regression)
逻辑回归( Logistic regression)http://www.mamicode.com/info-detail-501714.html https://baike.baidu.com/item/logistic%E5%9B%9E%E5%BD%92/2981575 http://blog.csdn.net/han_xiaoyang/article/details/49123419 h原创 2017-11-25 22:14:19 · 1258 阅读 · 0 评论